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本 书 介绍 了 有 关 因子 分 析 以 及 主 成 分 分 析 的 统计 学 知识 。 


本 书 主要 面向 以 下 读者 : 

© 阅读 完 《漫画 统计 学 》 或 者 具备 相同 程度 以 上 的 统计 学 知识 的 读者 
@ 对 因子 分 析 感 兴趣 的 读者 

@ 对 主 成 分 分 析 感 兴趣 的 读者 

@ 对 问卷 调查 感 兴趣 的 读者 


本 书 由 以 下 几 部 分 构成 : 

@ 第 1 章 问卷 调查 的 基础 知识 
@ 第 2 章 调查 问卷 和 问题 设计 
@ 第 3 章 数学 的 基础 知识 

@ 第 4 章 主 成 分 分 析 

@ 第 5 章 因子 分 析 


各 章 又 包括 : 
@ 漫画 部 分 
@ 对 漫画 部 分 进行 补充 的 文字 说 明 


此 外 ， 本 书 还 备 有 附录 。 附 录 中 介绍 了 一 些 在 《漫画 统计 学 》 和 《漫画 统计 学 之 
回归 分 析 》 里 出 现 过 的 、 著 名 的 分 析 方 法 。 

本 书 中 的 相关 计算 过 程 记录 得 相当 详细 ， 数 学 基础 好 的 读者 只 需 仔细 地 看 一 饥 即 
可 ,数学 基础 稍 差 的 读者 则 要 用 心 揣摩 , 多 加 思考 。 但 不 管 怎么 说 , 即便 是 那些 觉得 “ 意 
思 不 太 明白 、 计 算 起 来 也 困难 ”的 读者 ， 无 论 如 何 都 要 按照 书 中 的 步骤 把 解 求 出 来 ， 
这 样 做 起 码 可 以 掌握 大 致 的 计算 流程 。 没 必要 强迫 自己 马上 就 理解 ， 要 不 焦 不 躁 地 坚 
持 读 到 最 后 。 在 阅读 过 程 中 ， 请 您 一 定 要 全 神 贯 注 地 阅读 。 

作为 本 书 主要 内 容 的 因子 分 析 ， 其 计算 过 程 与 《漫画 统计 学 》 和 《漫画 统计 学 之 


回归 分 析 》 中 的 内 容 相 比 更 为 复杂 。 所 以 在 看 到 有 关 计算 过 程 的 部 分 时 ， 可 能 有 不 少 
读者 会 觉得 过 于 复杂 难 私 ， 因 而 没有 心情 看 下 去 。 这 时 请 您 坚持 住 ， 不 要 气 蚀 ， 继 续 
努力 。 因 子 分 子 的 计算 确实 比较 复杂 ， 但 是 只 要 具备 大 学 人 学 考试 水 平 (理科 ) 的 数 
学 知识 ， 就 绝对 不 会 感觉 到 “困难 "。 如 此 说 来 ， 对 于 数学 基础 不 是 很 好 的 读者 就 不 太 
好 讲 了 ， 可 能 还 是 会 觉得 比较 困难 ， 但 无 论 如 何 ， 都 请 您 不 焦 不 踩 地 读 到 最 后 。 





在 阅读 的 过 程 中 ， 会 存在 读者 自己 的 计算 结果 和 书 中 的 计算 结果 不 一 致 的 情况 ， 
这 是 由 于 四 合 五 人 的 原因 。 如 带 来 不 便 ， 还 请 诸位 读者 多 多 包涵 。 


能 够 有 这 次 执笔 的 机 会 ， 我 要 感谢 株式 会 社 欧姆 社 开发 局 的 诸位 ; 感谢 将 我 的 原 
稿 制 成 漫画 的 株式 会 社 TREND-PRO 的 诸位 ; 感谢 负责 脚本 的 re_akino 先生 ， 以 及 负 
责 绘画 的 Inoue Iroha 先生 。 对 于 立 教 大 学 社会 学 系 的 酒 折 文 武 先生 提出 的 诸多 建议 ， 
在 此 表示 深 深 的 谢意 。 
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高 津 nit 


大 一 新 生 。 天 生 的 乐天 派 ， 喜 怒 真 乐 变幻 无 常 ， 但 也 有 专 一 的 
一 面 ， 课 余 时 间 在 诺 伦 茶 餐厅 兼职 打工 。 


M 


ae 博 a 山本 F% 


露 儿 的 父亲 。 任 职 于 营销 公司 ， 露 儿 父亲 的 下 属 ， 生 活 中 总 是 
担任 部 长 之 职 。 十 分 宠爱 独 生 不 修 边 幅 。 曾 经 做 过 露 儿 的 家 
女 ， 言 行 也 赂 带 孩 子 气 。 庭 教师 ， 教 她 统计 学 知识 。 现 
在 和 露 儿 的 关系 在 朋友 和 恋人 
之 间 徘徊 。 
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ay Be 

大 学 三 年 级 学 生 ， 露 儿 打工 时 PARA, MILITIA HEE. 
的 伙伴 。 从 前 一 直 认为 数学 很 性 格 直爽 ， 颇 有 大 姐姐 风范 。 
难 ， 但 是 ， 自 从 某 个 契机 之 后 头脑 聪颖 ， 整 日 忙于 研究 学 习 。 
就 开始 对 统计 学 着 迷 了 。 
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露 儿 ， 你 在 日 本 
努力 完成 大 学 的 学 业 
就 可 以 啦 ! 


多 亏 了 山本 这 位 
优秀 的 家 庭 教师 ， 

















































































































从 此 以 后 ， 我 们 一 起 


奋斗 吧 | 
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今天 还 是 很 忙 
— 



























































AN, AM! 














理 纱 师姐 ! 
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诺 伦 茶 餐厅 调查 问卷 


参与 此 次 调查 的 顾客 将 可 获得 我 们 赠送 的 优惠 券 ， 请 在 结账 时 索取 ! 





性 别 男 、 女 # | 岁 

















职业 年 收入 | 万 日 元 





Q. 您 感觉 店内 的 就 餐 环 境 如 何 ? 
非常 不 好 不 好 - 般 好 非常 好 


Q. 您 感觉 女 服务 生 的 制服 和 服务 态度 如 何 ? 
非常 不 好 不 好 — 好 非常 好 


Q. 您 觉得 我 们 的 红茶 味道 如 何 ? 
非常 不 满意 。 不 满意 。 一 般 满意 ”非常 满意 


Q. 您 觉得 价格 如 何 ? 
便宜 适中 贵 


Q. 对 于 以 下 4 种 红茶 ， 请 您 按照 自己 的 喜好 程度 进行 排序 。 





1. 原味 红茶 
2 HOR 
3. 奶 茶 

4 玫瑰 茶 


1444 














Q. 您 喜欢 在 茶 餐 厅 就 餐 吗 ? 
喜欢 不 喜欢 














8 序言 你 和 我 的 因子 分 析 


这 哪里 是 1 wi 

My š > 
什么 因子 分 析 啊 ! | + 
更 不 会 有 人 * — 
回答 你 的 问题 ! Wee ‘ ! 


KIL, IL 
你 到 底 知 不 知道 
什么 


叫 
因子 分 析 啊 ? 


那么 ， 理 纱 师姐 ， J 您 在 研究 生 院 研究 
你 以 为 做 个 调查 问卷， Ë V 
把 这 些 数据 收 全 起 来 ， 请 您 教 教 我 吧 统计 学 ， 所 以 一 定 


因子 分 析 可 不 是 
这 么 简单 就 能 够 
完成 的 分 析 方 法 啊 | 


œ, BRH217 |A 













































































就 是 通过 多 个 变量 
对 数据 进行 分 析 的 


除了 因子 分 析 
还 有 很 多 其 他 
的 分 析 方 法 。 


1. 详 见 附录 (219 页 )。 


看 来 是 不 知道 


那 你 做 过 两 个 
变量 的 分 析 吗 ? 








那么 ， 


所 谓 因子 分 析 就 是 潜在 共性 因子 挖 拨 出 来 的 一 


将 数据 背后 的 AN š 种 分 析 方 法 。 





将 受 访 者 的 真实 想 
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好 更 清楚 
哪些 地 方 是 难点 ， 





所 以 我 才 认 为 
她 更 适合 
做 露 儿 的 老师 。 


S| ‘ 
SA 
j ‘a 
B 











= f p 
a a 








第 | 章 
问卷 调查 的 基础 知识 


ESS 


1. 抽样 方法 

2 调查 方法 

3. 样本 容量 的 标准 

4 随机 抽样 和 定向 抽样 
5. 定量 调查 和 定性 调查 
6 数据 分 析 的 搭配 方法 











啊 ? 我 们 不 是 学 习 


因子 分 析 吗 ? 

所 以 我 们 必须 要 先 

党 提问 卷 调查 的 相 
辛苦 你 了 ! 





fd 
s 
R 
x 
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X 
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学 习 一 下 问卷 调查 
基础 知识 吧 ! 





















































































































































因子 分 析 大 多 是 
先 通过 问卷 调查 
然后 再 进行 分 析 的 ， 


来 收集 数据 ， 
好 了 ， 今 天 我 们 


就 先 学 “抽样 方法 ” 
和 “调查 方法 " 吧 ! 
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$ 1. 抽样 方法 ç 





你 知道 “总 体 ” 和 “样本 
指 的 是 什么 吗 ? 






由 全 部 调查 对 象 所 组 成 的 从 总 体 中 抽出 的 若干 个 个 体 
所 组 成 的 集合 称 为 样本 | 
总 


N 


Ñ \ A 
EAN 


以 样本 为 对 象 的 调查 
称 为 “抽样 调查 "。 


以 总 体 为 对 象 的 调查 
A HE, 





样本 ， 
如 果 并 不 能 成 为 "总 体 的 精确 


缩影 的话， 那么 ， 做 样本 分 
析 也 就 失去 意义 了 ， 明 白 吗 ? 


为 了 避免 这 种 情况 
发 生 ， 我 们 就 要 确 
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MELL, 

就 是 将 样本 从 总 体 中 
抽出 的 方法 的 统称 。 
抽样 方法 分 很 多 种 ， 





作为 代表 性 的 方法 ， 我 们 
今天 介绍 以 下 四 种 : 


“简单 随机 抽样 法 ” 
“分 层 抽 样 法 ” 
“二 阶 抽样 法 ” 
“分 层 二 阶 抽样 法 ” 


(D 简单 随机 抽样 法 


“简单 随机 抽样 ”就 是 
从 总 体 中 随机 地 抽取 
个 体 的 抽样 方法 。 





恰 如 其 名 ， 确 实 是 
但 是 ， 如 果 全 国 姓 


这 种 方法 常常 用 来 进行 
像 “ 某 大 型 企业 的 员工 
意识 调查 ”这 样 的 调查 ， 


有 时 虽然 可 以 拿 到 全 体 

成 员 的 名 册 ， 但 是 人 数 

过 多 ， 不 适合 进行 普查 ， 

这 时 可 以 用 简单 随机 抽 
的 方法 。 
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[ese 2 | 










它 是 先 将 总 体 按照 “出 生 
W ERER, k 
或 " 景 高 学 历 "等 属性 划 
分 出 不 同 的 层 … 







然后 再 针对 每 层 
做 简单 随机 抽样 


层 得 到 的 调查 
结果 也 会 有 较 
大 的 差别 。 


当 这 些 状况 能 够 事前 
HHHH, CORA 








ERR RA 





















“喜欢 哪 类 食品 ” 扩 类 问题 可 能 会 
因 “ 地 壕 ” 的 不 同 而 有 所 不 同 。 


“ 豆 欢 哪 位 明显 ” 按 类 问题 可 能 会 
因 “ 出 生年 代 ” 的 不 同 而 有 了 所 不 同 。 


那 就 用 “出 生地 ”分 层 
来 练习 一 下 分 层 抽样 法 





a 构成 比 
0.045 三 重 县 1800000 | 0014 
0011 Sng 1300000 | 0.010 
oon 京都 府 2600000 | 04021 
0018 ABE 8700000 | 0070 
0.009 兵 库 县 5500000 | 0.044 
0.010 奈良 县 | 1400000} 0011 
0.017 mku | 1000000 | 0008 
0.023 mst | 600000 | 0005 
0.016 岛 根 县 700000 | 0006 
0016 Mt g 1900000 | 0015 
0.055 广岛 县 2800000 | 0.022 
0.047 山口 县 1500000 | 0012 
0.096 ang 800000 | 0.006 
神奈川 县 0.067 香川 县 1000000 | 0.008 
smu 0.019 men 1400000 0011 
富山 县 . 高 知县 800000 | 0.006 
IB I wir | 500000 0040 
福井 县 r KRE 800000 | 0.006 
山梨 县 )( Kan 1500000 | 0.012 
长 野 县 能 本 县 1800000 | 0.014 
wR 大 分 县 1200000 | 0010 
WRH Wan 1100000 | 0.009 
爱 知县 谭 儿 岛 县 1700000 | 0.014 
冲绳 县 1300000 | 0.010 
Bit | 124600000] 1 1800 
当地 人 口 数 _ 7000000 -0056 《以 上 数据 参考 2006 年 度 日 本 总 务 省 统计 局 资料 制 成 ) 
总 人 口 124 600 000 





























总 抽取 人 数 x 构成 比 = 1800 x 0.056 = 101.1==100 


就 像 这 样 
从 爱 知 县 抽出 100 A, 
从 东京 都 抽出 170 人 
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抽取 相应 的 人 数 





R! 
依据 构成 比 


8 


而 有 全， 名 册 中 还 一 


E 
E 
nif 
R 
R 
te 
s 
w 


依据 的 信息 。 


这 种 方法 是 不 是 也 
一 定 要 有 全 员 名 单 








“二 阶 抽样 法 ”就 是 
分 2 个 阶段 抽取 孝 


拿 我 们 现在 做 的 例子 来 说 ， 
Hehe 按照 出 生地 
原则 进 


REE, REER, 
其 他 属性 也 可 以 ， 


现在 来 看 看 
它 的 详细 过 程 吧 | 
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目前 47 个 地 区 的 人 口 数 
大 致 如 下 所 示 。 





累积 人 口 
下 限 值 


aa 


1 READ 


' 上 限 值 


READ | RBAN 
下 限 值 | ERM 





ditit 
青森 县 
HFR 
宫 城 县 
秋田 县 
山形 县 
MAR 
菊 城 县 
WAL 
群 马 县 
HERL 
Forse 
东京 都 
神 厅 川上 
Wik 
富山 县 
MR 
福井 县 
山梨 县 
长 野 县 
por 
Wr 


1 
5600001 
7000001 
8400001 

10700001 
11800001 
13000 001 
15100001 
18000 001 
|20000001 
|22000001 
28900001 
34 800 001 
|46800001 
‘55200001 
57600001 
|58 700001 
(59800001 
(60600001 
61400001 
'63 600001 
|65 700001 








爱 知 县 





69400001 


T 560000 
+ 7000000 
£ 8400000 
‘10700000 
+11 800 000 
113000000 
‘15 100000 
118000000 
120000000 
122000000 
128900000 
134800000 
‘46 800 000 
155 200000 
‘57.600 000 
158 700000 
'59 800000 
160600000 
‘61 400000 
163 600000 
‘65700000 
169 400000 


176400000 





三 重 县 
滋 贺 县 
京都 府 
BE 
兵 库 县 
奈良 县 
Taal B: 
鸟 取 县 
岛 根 县 
网 山 县 
广岛 县 
山口 县 
ean 
香川 县 
RRA 
高 知县 
福冈 县 
ERE 
长 崎 县 
熊本 县 
大 分 县 
宫 崎 县 
RLS 
Riza ccd 


1500000 
1800000 
1200000 
1100000 
1700000 
1300000 


100000000 
101 900000 
104 700000 
106 200000 
107000000 
108 000 000 
1109 400000 
110 200 000 
115 200 000 
116 000 000 
117500000 
119300000 
[120 500 000 
|121 600000 
123 300000 


76400001 ' 78 200000 
78200001 | 79 500000 
79500001 ' 82 100000 
82 100001 ; 90 800000 
90800001 ` 963000000 
96300001 | 97700 000 
97700001 ` 98 700.000 
98 700 001 ; 99 300000 
99300001 100000000 
1100 000.001 101 900 000 
101 900001 104 700 000 
104700 001 106 200 000 
1106 200 001 107 000 000 
1107 000.001 108 000 000 
1108000001 109400 000 
{109 400 001 110200 000 
110.200 001 115 200000 
1115 200001 {116 000.000 
116 0000001 117 500 000 
1117 500001 $119 300 000 
119 300 001 120 500 000 
120 500001 121 600 000 
121 600001 123 300 000 
1123 300 001 124 600 000 








总 计 


124600000 


124 600 000 
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使 用 Excel 中 的 “Rand” 等 函 ED 步骤 1 中 求 出 的 随机 数 将 会 介 于 

数 ， 在 1 到 124 600 000 中 求 出 某 个 地 域 的 “累积 人 口上 限 值 ” 

10 个 随机 数 。 和 “累积 人 口 下 限 值 ”之 间 ， 找 
出 这 一 区 域 。 





随机 数 1 104 333 307 随机 数 1 104 333 307 
随机 数 2 8007 588 随机 数 2 8007 588 
随机 数 3 35 224 073 随机 数 3 35 224 073 
随机 数 4 72 352 247 随机 数 4 72 352 247 
随机 数 5 3951 586 随机 数 5 3 951 586 
随机 数 6 114 308 209 随机 数 6 | 114 308 209 
随机 数 7 3724 893 随机 数 7 3724893 
随机 数 8 100701 197 随机 数 8 100 701 197 
随机 数 9 62 591 858 随机 数 9 62 591 858 
随机 数 10 89 167 908 随机 数 10 | 89 167 908 


广岛 县 
岩手 县 
东京 都 
爱 知县 
北海 首 
福冈 县 
北海 道 
冈 山 县 
长 野 县 
大 版 府 


Pdi 


这 里 的 “124 600 000” 是 
47 个 地 区 人 口 的 总 和 。 
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ERD IIR 2 htt) 10 4383531 
随机 抽出 180 人 。 


在 北海 道 要 抽出 360 AK, 
不 过 在 这 种 情况 下 ， 


x 进行 2 次 “随机 抽出 180 人 ” 
V 进行 1 次 “随机 抽出 360 A” 


T 这 个 才 是 正确 的 。 








在 这 个 例子 中 从 10 个 
地 域 中 各 抽出 180 A, 
但 实际 上 , “所 抽出 的 地 
域 个 数 ”以 及 “各 地 域 


分 析 者 的 判断 ， 视 情况 





而 定 的 。 
我 明白 了 1 
‘9 r OH 
E 
! — 
— 
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À 在 第 1 阶段 中 ， 只 
= š 要 有 被 抽取 地 域 的 
二 阶 抽样 法 同 简单 随机 f = h 
抽样 法 或 分 层 抽样 法 吧 | 名 单 就 可 以 了 


首先 ， 我 们 必须 知道 第 1 阶段 
中 各 地 域 的 准确 人 数 ， 否 则 就 
无 法 进行 调查 ， 是 吧 ? 








此 外 ， 在 第 1 阶段 中 ， 
没有 被 拍 到 的 地 域 的 人 们 
他 们 的 意见 ， 将 被 我 们 忽视 。 


顾名思义 ， 就 是 分 层 抽 
样 法 和 二 阶 抽样 法 相 结 
会 而 成 ， 我 用 图 大 致 地 
讲解 一 下 。 























— 
以 查 遍 全 国 ， 而 且 还 不 
需要 总 体 的 “全 员 " 名册。 

EY, RARE 


在 规模 较 大 的 调 
用 的 抽样 方法 。 


* 


RK SEHK 
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我 们 就 讲 完了 ， 
我 们 讲 调查 方法 。 


调查 方法 也 可 以 分 为 
很 多 不 同 的 类 型 。 
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RDD 调 查 
(Random Digit Dialing) _ 





这 些 调查 方法 都 很 重要 ， 
不 过 ， 我 们 先 来 详细 了 
解 一 下 其 中 具有 代表 性 
的 邮寄 调查 和 网 络 调查 
的 特点 。 

































邮寄 调查 网 络 调查 
将 调查 问卷 寄 给 受 访 省 ， 开放 型 
请 受 访 者 完成 问卷 后 寄 不 限定 参与 人 数 ， 通 过 互联 网 
回 的 方法 。 来 收 信访 问 结果 的 方法 。 
监控 型 
A 计 全 监控 页 (monitor)， 通 过 互 
联网 来 收集 访问 结果 的 方法 。 
地 | 能 够 广泛 地 对 各 地 人 群 进行 调查 。 | 能 够 广泛 而 全 面 地 对 各 地 人 群 进行 
域 | 为 了 使 调查 问卷 可 以 准确 寄 出 ， 调查 。 受 访 者 自愿 参与 ， 无 需 学报 
和 | 必须 掌握 名 单 中 人 员 的 地 址 等 | 受 访 者 地 址 等 信息 。 
名 | 信息 。 | 
单 
由 于 受 访 者 无 须 在 国定 的 连续 时 受 访 者 回答 问题 时 需要 一 
访 | 间 内 完成 ， 所 以 可 以 根据 A | 气 呵 成 ， 基 本 上 不 允许 中 
间 | 各 自 的 情况 决定 回答 的 时 断 。 所 以 ， 不 能 设计 过 多 
E| 间 。 如 此 一 来， 便 可 以 设计 y 的 问题 。 
较 多 的 问题 。 | 
通常 ， 只 用 20%~30% 的 调查 问 关 能 够 得 | 开放 型 ? 
Amk, BRIM A Hh AE a RT — 
完全 反映 总 体 特征 的 料 本 ， 从 而 精心 朱 计 pb 
受 访 者 ， 并 等 出 调查 问卷 的 ， 但 是 等 回 问 | 的 选择 上 进行 设 8 
卷 的 构成 比 ， 却 不 能 保证 该 样本 完全 地 反 
回 | TARA. | 监控 型 
* | 加 然 样本 是 经 过 监控 页 的 选 
的 择 而 产生 的 ， 但 并 不 能 说 这 
hi 些 样本 完全 反映 了 总 体 特征 。 
É 由 于 监控 页 在 进行 抽样 时 总 
APR ACHI, MAR 
难说 被 抽取 样本 可 以 代表 
“普通 ”人 群 的 总 体 情况 。 
Ba wk. Ra. 
收 间 l 
数 | 由 分 析 者 (或 其 他 人 员 ) | 由 受 访 者 录入 。 也 就 是 说 ， 
据 | 录入 。 受 访 者 在 回答 的 同时 便 将 
的 数据 自动 录入 ， 因 此 省 去 
z 了 RA’ 这 一 工序 。 

















As 


wp. 
HE 


动机 不 纯 吧 了 Y 
j 








Z 3. 样本 容量 的 标准 & 





样本 中 的 个 体 数目 称 为 样本 容量 。 

样本 容量 越 大 ， 就 越 接近 总 体 的 数量 ， 但 不 会 超过 总 体 的 数量 。 因 此 ， 想 获得 大 
一 些 的 样本 容量 ， 就 要 尽 可 能 多 地 收集 数据 。 

话 虽 如 此 ， 但 数据 的 收集 时 间 和 资金 预算 也 是 我 们 要 考虑 的 现实 问题 ， 所 以 扩大 
样本 容量 也 不 是 一 件 容易 的 事 。 这 样 一 来 ， 我 们 便 产 生 了 这 样 一 种 想法 :“ 只 要 对 样 
本 容量 达到 xx 程度 的 数据 进行 分 析 ， 就 可 以 得 到 理想 的 结果 ， 即 可 以 较 好 地 代表 总 
体 数据 的 特征 "。 也 就 是 说 ， 我 们 期 待 着 存在 一 个 “统计 学 最 低 标准 ”的 值 ， 但 遗 居 
的 是 并 没有 这 样 的 值 存在 。 

“样本 容量 的 统计 学 最 低 标准 ”是 不 存在 的 。 但 是 ， 在 问卷 调查 领域 中 ， 通 常 都 
会 有 一 个 “ 约 400” 的 最 低 标准 ,不 过 这 个 标准 也 不 能 说 是 合理 的 。“ 约 400” 只 是 “出 
于 某 种 考虑 ”而 设 定 的 值 ， 并 不 能 无 条 件 地 令 人 信服 。 但 有 不 少 人 相信 存在 着 这 样 一 
个 “ 虽 不 确切 ,但 是 在 统计 学 上 仍然 能 够 值得 信赖 的 值 "。 那 么 ， 这 个 “ 约 400” 是 
怎样 得 出 来 的 呢 ， 我 们 简要 地 在 下 面 做 些 解释 。 同 时 也 给 出 注意 事项 。 


A 报社 想 在 一 个 月 后 做 如 下 问卷 调查 。 





Q. BRA AAI? ( 只 能 选择 其 中 一 项 ) 
1. 支 持 2. 不 支持 














为 了 避免 问题 复杂 化 我们 只 做 简单 说 明 。 实 际 上 ,统计 学 中 在 进行 问卷 调查 之 
前 ， 有 这 样 的 前 提存 在 。 


作为 总 体 的 “全 体 选民 ”对 内 阁 的 支持 率 为 P， 虽 然 无 法 通过 统计 学 的 手 
段 得 出 其 具体 的 结果 ， 但 这 一 结果 一 定 会 出 现在 下 面 这 一 范围 内 : 


T 
p-196x PTP < p< p+ 1965 / PX( =p) 


K 为 总 体 对 内 阁 的 支持 率 ，p 为 样本 对 内 阁 的 支持 率 ，n 为 样本 容量 。 
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我 们 一 般 假定 这 个 预测 的 置信 度 是 95%。 顺 便 说 一 下 ， 所 谓 置 信 度 就 是 “上 面 
方 框 中 内 容 的 可 信 性 "， 又 称 置信 水 平 或 置信 系数 。 
请 再 观察 一 下 之 前 方 框 中 的 内 容 。 


196x / PX 的 值 越 小 ，P 的 范围 就 越 窗 ， 说 服 力也 就 越 强 。 因 此 ， 


.对 于 有 说 服 力 的 结果 ，1.96XW/ PXD 的 值 应 为 的 串 以 下 。 


+ 当 处 于 必须 再 做 一 次 问卷 调查 才能 得 出 结论 的 情况 时 ，P 的 值 恰好 在 0 
和 1 的 正中 间 0.5 处 , BI p=05. 





如 果 无 条 件 地 接受 上 述说 法 ， 那 么 就 可 以 推导 出 以 下 结果 : 


OSX(=03) 1 
196x 5X009 cost 
196x, / 25X0 -05 <005 
196 05x003) 

196 x ISKU I ci 


G% x Cd 05) < 1 


— 38) x05x(1-0.5)<n 


384.2 < n 


这 个 384.2， 就 是 之 前 所 说 的 “ 约 400". 


对 于 这 个 “ 约 400"， 需 要 注意 以 下 4 点 : 
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第 一 , 不 要 抱 有 这 种 想法 :“ 只 要 收集 约 400 份 数据 就 可 以 得 到 一 个 准确 的 结果 ”。 
例如 ,就 “对 于 宪法 第 9 条 持 什 么 看 法 ? ”这 个 问题 ,调查 “400 名 A 报纸 的 购买 者 ”， 
所 得 出 的 结论 也 许可 以 确定 A 报 购买 者 的 整体 意见 ， 但 是 其 结果 却 无 法 反映 全 体 国 
民 的 意愿 。 

第 二 ,不 要 抱 有 这 种 想法 :“ 如 果 数 量 不 足 400 就 不 能 得 到 足够 可 信 的 结果 ”。 例 如 ， 
就 “对 于 宪法 第 9 条 持 什么 看 法 ? ”这 个 问题 ， 如 果 是 对 “A 报纸 的 400 名 购买 者 ” 
进行 访问 ， 反 而 不 如 对 “A 报纸 、B 报纸 、C 报纸 、D 报纸 、E 报纸 各 50 人 ”进行 
调查 所 得 的 结果 更 能 说 明 问题 。 

第 三 ,我 们 再 回头 去 看 “ 约 400” 的 推导 过 程 。 当 只 有 一 个 问题 “您 支持 x x 
议案 吗 ? ”以 及 两 个 选项 “支持 “不 支持 ”时 ， 可 知 ， 所 谓 的 “ 约 400” 是 在 “ 仅 
有 1 个 2 选项 问题 ”的 情况 下 ， 所 得 出 的 结论 ， 但 如 果 是 “10 个 5 选项 问题 ”就 不 
能 得 出 这 个 结论 了 。 即 这 个 值 并 不 是 在 所 有 情况 下 都 适用 。 

第 四 ， 读 者 阅读 时 可 能 会 觉得 奇怪 ， 前 一 页 的 方 框 内 怎么 会 有 打 阴 影 的 地 方 。 实 
际 上 ， 阴 影 部 分 的 取 值 也 不 是 绝对 的 ， 分 析 者 可 以 根据 自己 的 情况 进行 定义 。 比 如 
KH “AF” 改 用 “区 以 下 "\ 不 用 “p=0.5" 改 用 “p=0.273”, 全 由 分 析 者 自己 掌握 。 
这 样 一 来 ， 由 于 阴影 部 分 的 定义 不 同 ， 就 会 导致 计算 结果 和 所 谓 的 “ 约 400” 产 生 大 
不 相同 的 情况 。 





BA. 随机 抽样 和 定向 抽样 客 





抽样 方法 大 致 可 以 分 为 随机 抽样 和 定向 抽样 两 种 。 随 机 抽样 ， 就 是 将 构成 样本 的 
个 体 从 总 体 中 等 概率 地 抽取 出 来 的 方法 。 第 19 页 至 第 29 页 所 讲 过 的 : 


* 简单 随机 抽样 法 
+ 分 层 抽样 法 
“二 阶 抽样 法 
“分 层 二 阶 抽样 法 


这 些 都 是 抽样 的 一 种 。 定 向 抽样 ， 就 是 随机 抽样 以 外 的 抽样 方法 ， 也 就 是 将 构成 
样本 的 个 体 从 总 体 中 非 等 概率 地 抽取 出 来 的 方法 。 
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下 表 中 列 出 了 几 种 定向 抽样 法 。 











介绍 法 " 以 熟人 或 朋友 为 调查 对 象 ， 获 取样 本 的 方法 。 
征召 法 以 读者 意见 反馈 卡 等 方式 招募 调查 对 象 ， 获 取样 本 的 方法 。 
拦截 法 在 商业 街 或 街角 等 处 寻找 调查 对 象 ， 获 取样 本 的 方法 。 


通过 定向 抽样 法 获得 的 样本 ， 一 定 不 会 是 “总 体 的 精确 缩影 "。 这 样 说 ， 有 些 读 
者 或 许 会 认为 定向 抽样 法 是 一 种 不 太 好 的 方法 ， 但 事实 并 非 如 此 ， 其 原因 在 下 一 节 中 


再 做 说 明 。 


1 又 称 机 缚 法 。 以 熟人 或 朋友 为 调查 对 象 ， 再 由 他 们 不 断 地 介绍 新 的 调查 对 象 ， 我 们 将 其 称 为 滚雪球 法 - 
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& 5. 定量 调查 和 定性 调查 & 















































至 此 ,我 们 已 经 讨论 了 许多 不 同 的 抽样 方法 和 调查 方法 之 间 的 区 别 ， 但 是 在 此 之 
前 ， 最 初 的 调查 大 致 被 分 为 定量 调查 和 定性 调查 两 种 ， 如 下 图 所 示 。 
调查 
定量 调查 定性 调查 
抽样 方法 
随机 抽样 定向 抽样 
“简单 随机 抽样 法 “介绍 法 
` 分 层 抽样 法 “征召 法 
` 二 阶 抽样 法 “拦截 法 
“分 层 二 阶 抽样 法 
调查 方法 
邮寄 调查 网 络 调查 
现场 调查 留置 调查 
电话 调查 RDD 调查 
人 图 1.1 调查 、 抽 样 方法 以 及 调查 方法 
所 谓 定量 分 析 , 大 体 上 讲 , 就 是 以 “问卷 调查 收集 的 数据 ”或 “官方 的 统计 数据 ” 
为 基础 对 事物 进行 考察 的 调查 方法 。 在 本 书 的 讲解 中 , 除了 本 节 以 外 , 均 为 定量 调查 。 


所 谓 定性 调查 ， 大 体 上 讲 ， 就 是 以 少数 人 作为 调查 对 象 ， 就 是 人 们 常 说 的 “采访 ”。 
定量 分 析 具 有 以 下 优点 : 


“ 所 得 结果 客观 


“结果 具备 广泛 适用 性 
* 重复 率 高 
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另 一 方面 ， 它 也 难免 存在 缺点 ， 如 不 能 从 受 访 者 处 得 到 更 深层 面 的 信息 。 也 就 是 
说 ， 所 获得 的 总 体 信息 也 只 能 达到 “情况 大 致 如 此 ”的 程度 。 我 们 再 来 看 定性 分 析 ， 
它 和 定量 分 析 的 性 质 刚 好 相反 。 总 的 来 说 ， 由 于 是 采访 的 缘故 ， 所 以 就 可 以 获得 受 访 
者 更 深层 面 的 信息 ， 这 也 正 是 定性 分 析 的 优点 。 但 另 一 方面 ， 它 还 存在 如 下 缺点 : 


* 所 得 结果 不 够 客观 
* 结果 不 具备 广泛 适用 性 
` 重复 率 不 高 


如 此 说 来 ， 你 可 能 会 觉得 定性 分 析 不 是 一 个 好 的 分 析 方法 。 但 是 ， 千 万 不 要 这 样 
认为 。 假 如 ， 您 是 某 个 公司 的 一 名 职员 ， 那 么 请 先 设想 一 下 ， 以 下 两 项 关于 该 公司 产 
品 的 调查 。 





随机 抽取 1000 人 ， 通 过 调查 问卷 ， 征 求 其 对 现 有 产品 的 意见 。( 注意 ， 这 1000 人 中 还 包 
含 很 多 并 不 认为 本 公司 产品 优 于 其 他 同类 产品 的 人 ) 


调查 1 





找 来 10 位 主动 要 求 为 本 公司 产品 进行 评价 的 用 户 ， 进 行 圆桌 会 议 ， 对 现 有 产品 进行 一 次 


调查 2 | 科 底 的 调查 访问 。 





前 者 就 是 “通过 随机 抽样 法 进行 的 定量 调查 "， 而 后 者 则 是 “通过 定向 抽样 法 进 
行 的 定性 调查 "。 您 觉得 怎么 样 ? 当然 ， 我 们 还 要 看 调查 的 目的 是 什么 ， 不 能 就 表面 
情况 一 概 而 论 。 但 是 ， 我 们 也 不 能 盲目 地 断定 ， 前 者 就 是 一 个 好 的 调查 方法 ， 后 者 也 
有 其 实际 的 应 用 价值 。 

并 且 ， 就 定量 调查 而 言 ， 对 使 用 随机 抽样 法 获得 的 样本 进行 分 析 自 然 是 无 可 厚 非 
的 ， 不 过 对 使 用 定向 抽样 法 获得 的 样本 进行 分 析 也 是 可 以 的 。 就 定性 分 析 而 言 ， 绝 大 
多 数 情况 下 ， 都 是 对 使 用 定向 抽样 法 获得 的 样本 进行 分 析 ， 但 是 话 虽 如 此 ， 对 随机 抽 
样 法 获得 的 样本 进行 定性 分 析 也 不 是 不 可 以 的 。 
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& 6. 数据 分 析 的 搭配 方法 < 





以 下 要 讲 的 内 容 也 是 相当 重要 的 ， 但 是 同 之 前 所 讲 的 内 容 有 所 不 同 ， 请 调整 思路 
再 做 阅读 。 
数据 分 析 的 搭配 方法 有 两 种 类 型 : “探索 型 ”和 “验证 型 "。 





“探索 型 ”的 数据 分 析 流程 


D 收集 手头 资料 。 

Q 试 着 运用 各 种 分 析 方法 ， 进 行 全 面 分 析 。 

图 如 “事后 诸葛 ” 般 优 然 大 悟 “ 原 来 世上 还 有 这 样 的 事 ”。 
图 向 周围 的 人 公布 自己 的 分 析 结果 。 








“验证 型 ”的 数据 分 析 流程 


中 建立 假设 。 

@ 为 了 确认 假设 是 否 成 立 ， 收 集资 料 ， 并 进行 分 析 。 
图 得 出 结论 ， 即 假设 成 立 与 否 。 

图 向 周围 的 人 公布 自己 的 分 析 结果 。 








“探索 型 ”的 数据 分 析 ， 只 需要 手头 的 数据 即 可 ， 其 优点 在 于 能 够 简单 、 快 速 地 
完成 分 析 。 另 一 方面 ， 它 也 存在 弊端 ， 如 数据 被 随意 加 工 、 变 量 间 被 强加 上 想当然 的 
因果 关系 ， 从 而 可 以 让 “事后 诸葛 ” 们 乱 说 一 气 。 更 有 甚 者 ， 便 会 “为 所 欲 为 ”了 。 
因此 ,纵然 是 费 了 一 番 工 夫 得 来 的 分 析 结果 ， 周 围 的 人 还 是 有 可 能 会 觉得 这 一 结果 缺 
乏 说 服 力 。 

“验证 型 ”的 数据 分 析 ， 一 定 要 在 调查 的 最 初 阶段 建立 假设 ， 所 以 着 手 分 析 时 会 
比较 困难 ， 这 也 正 是 它 的 缺点 。 但 另 一 方面 ， 假 设 一 旦 建立 ， 接 下 来 便 是 收集 数据 和 
分 析 数 据 。 经 过 一 番 分 析 ， 如 果 假 设 成 立 ， 就 可 以 得 到 一 个 非常 有 说 服 力 的 结果 ， 获 
得 周围 人 的 认同 。 即 便 假设 不 成 立 ， 我 们 同样 可 以 得 到 一 个 事实 “至 少 这 个 假设 不 
成 立 ”， 这 对 指导 今后 的 研究 是 很 有 帮助 的 ， 所 以 绝 不 能 说 这 是 一 个 没有 意义 的 数据 
分 析 。 
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第 2 章 
调查 问卷 和 问题 


1. 调查 问卷 的 构成 

2. 问题 的 分 类 

3. 应 当 避 免 的 问题 

4 应 当 避 免 的 问题 ( 续 ) 
5.“ 中 值 ” 的 存在 性 
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RAE! 





P 











种 儿 还 是 个 学 生 ， 


好 的 任务 是 踏 踏 


实 实地 完成 学 业 。 

















虽然 见 不 到 山本 ， 
可 露 儿 还 是 很 精神 
有 1! 








今天 我 们 要 讲 调查 二 入 








,| 


无 论 是 调查 问卷 的 构成 
还 是 询问 的 问题 都 没有 A 
一 个 所 谓 的 “最 佳 法 则 "， ~ IS 
但 是 LL, 
还 是 有 一 些 规则 能 
使 问卷 和 问题 的 设 
计 更 科学 合理 一 些 





这 里 有 一 份 关于 某 
一 茶 材 厅 不 太 合适 














<` 顾客 调查 问卷 ce 





图 顾客 情况 调查 
Q1. 请 问 您 的 性 别 是 ( 只 能 选 1 项 ) 
1. 男性 2 女性 


| P 


Q3. 请 问 您 的 职业 是 ( 只 能 选 1 项 ) 














Q2. 请 问 您 的 年 龄 是 











L 职员 2 个 体 经 营 3. 学 生 

4 主妇 5. 其 他 ( ) 
图 关于 本 店 的 问题 
Q4. 您 觉得 工作 人 员 的 态度 如 何 ? ( 只 能 选 1 项 ) 

1. 48 2# 3. 一 般 4 好 5. 很 好 





Q5. 您 对 所 点 的 蛋糕 及 饮品 的 口味 是 否 满意 ? ( 只 能 选 1 项 ) 




















1. 很 不 满意 2. 不 满意 -好 4 满意 5. 很 满意 
Q6. 您 为 何 光临 本 店 ? ( 可 选 多 项 ) 
1. 在 杂志 或 广告 中 见 过 2 访问 过 主页 3. 听 朋 友 或 熟人 介绍 
4 碰巧 路 过 5. 喜欢 店面 的 设计 6 其 他 ( ) 
十 分 感谢 您 的 合作 ! 











RAIA TERE 


调查 问卷 而 已 啊 上 从 


° 
7 LN SE | 
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SS. 顾客 调查 问卷 GH 





图 关于 本 店 的 问题 
Q1. 您 觉得 工作 人 员 的 态度 如 何 ? ( 只 能 选 1 项 ) 
1. 482 2% 3. 一 般 4 好 5. 很 好 





Q2. 您 对 所 点 的 蛋糕 及 饮品 的 口味 是 否 满意 ? ( 只 能 选 1 项 ) 
1. 很 不 满意 2. 不 满意 3. fit 4 满意 5. 很 满意 








Q3. 您 为 何 光临 本 店 ? ( 可 选 多 项 ) 



































1. 在 杂志 或 广告 中 见 过 2. 访 问 过 主页 3. 听 朋 友 或 熟人 介绍 

4 碰巧 路 过 5. 喜欢 店面 的 设计 6. 其 他 ( ) 
m 顾客 情况 调查 
Q4. 请 问 您 的 性 别 是 ( 只 能 选 1 项 ) 

1. 男 性 2 女性 J 
Q5. 请 问 您 的 年 龄 是 

岁 

Q6. 请 问 您 的 职业 是 ( 只 能 选 1 项 ) 

1. 职员 2. 个 体 经 营 3. 学 生 








4 .主妇 5. 其 他 ( ) 














但 是 问题 本 身 
并 没有 变化 ， 对 吧 ? 





D 
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在 前 一 份 调查 问卷 中 
开始 就 询问 性 别 啊 
年 龄 啊 这 些 个 人 信息 ， 
是 不 是 ? 


如 此 一 来 ， 受 访 者 就 
会 想 “ 为 什么 一 定 要 
MARZAN?” 


正如 你 所 说 
的 那样 。 


8 
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如 果 一 开始 就 问 你 
KEG a 


The 


但 是 ， 如 果 先 问 你 平时 
的 运动 量 ， 或 是 为 了 保 
持 健康 所 注意 的 事情 等 











询问 “现状 ” 
是 否 接触 过 、 是 否 拥有 、 什 么 时 候 买 的 、 
在 哪里 买 的 ， 等 等 。 





| 





询问 “意识 ” 
满意 或 不 满意 之 处 、 满 意 或 不 满意 的 理由 、 





价值 观 ， 等 等 。 





询问 “属性 ” 
性 别 、 年 龄 、 婚 姻 状 况 、 收 入 、 最 高 学 历 、 
家 庭 结构 ， 等 等 








说 不 定 这 份 茶 餐 厅 的 
调查 问卷 是 一 个 初学 
者 做 的 。 


在 调查 问卷 中 ， 


首先 要 询问 受 访 者 
的 行为 或 经 验 这 些 
“现状 ”层面 的 东西 ， 


接 下 来 再 询问 感觉 
路、 想法 路 这 些 “ 意 识 ” 
层面 的 东西 ， 


最 后 再 询问 “ 属 
性 " 层面 的 东西 。 


这 样 的 结构 才 


这 就 是 我 一 开始 给 | 
诺 伦 做 的 调查 问卷 J 





























调查 问卷 中 的 问题 大 到 可 分 为 


单项 选择 题 "、“ 多 项 选择 题 "、 
“数量 题 "、“ 文 字 题 ” 等 。 





单项 选择 题 





首先 是 单项 选择 题 。 
也 就 是 只 尤 许 选 择 一 个 选项 的 问题 。 








Q. 请 问 下 列 哪 种 蛋糕 是 您 最 喜爱 的 ? ( 限 选 一 项 ) 





1. 油 本 蛋糕 2. 奶酪 蛋糕 3. 巧克力 蛋糕 4 蒙 布朗 











,在 您 选择 单 人 住房 时 ， 是 否 重视 与 最 近 车 站 的 距离 ? 
( 限 选 一 项 ) 








1. 不 重视 2. 不 太 重视 3. 一 般 4 有 此 重视 

















Q. 在 您 选择 单 人 住房 时 ， 对 以 下 事项 的 重视 程度 如 何 ? ( 限 选 一 项 ) 





不 太 
ae 重视 





| a 距 最 近 车 站 的 距离 
b. 房间 朝阳 
c. 储 物 空间 
d 房租 
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多 项 选择 





接 下 来 是 多 项 选择 题 。 
也 就 是 同一 道 题 可 以 选择 多 个 选项 的 问题 。 








Q. 请 问 您 在 选择 单 人 住房 时 比较 看 重 哪 些 条 件 ? 
(可 选 多 项 ) 


1. 距 最 近 车 站 的 距离 2. 房间 朝阳 3. 储 物 空间 
4 房租 5. 周边 设施 


另外 , 还 有 下 面 这 种 询问 方式 , 但 是 并 不 推荐 大 家 使 用 。 > 9 


Q. 请 问 您 在 选择 单 人 住房 时 比较 看 重 哪些 条 件 ? 
(最 多 选 两 项 ) < 


1. 距 最 近 车 站 的 距离 2 房间 朝阳 3. 储 物 空间 
4 房租 5. 周边 设施 









































与 “可 选 多 项 ” 相 比 ， 这 种 设计 要 求 受 访 者 必须 先 将 全 部 
选项 浏览 一 遍 之 后 才能 作答 ， 这 样 无 形 中 会 增加 受 访 者 的 
负担 。 
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接 下 来 是 数量 题 。 
也 就 是 需要 回答 具体 数值 的 问题 。 
这 时 要 用 线 将 每 一 位 数字 隔 开 ， 以 免 书写 时 出 现 错误 。 








Q. 您 的 家 庭 月 消费 平均 是 多 少 ? 
万 T 


























最 后 是 文字 题 。 
也 就 是 不 需要 选择 选项 ， 而 是 需要 自由 做 答 的 问题 。 








Q. 请 列举 出 1 位 您 最 喜欢 的 艺人 。 





答题 栏 

















Q. 如 果 您 对 本 店 还 有 什么 意见 或 要 求 ， 请 提出 来 。 





o EY 
N 
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让 我 们 一 起 看 一 下 
小 种 儿 制 作 的 那 份 


最 后 … 诺 伦 的 调查 问卷 


就 币 下 应 当 吉 免 的 有 何不 委 之 处 吧 | 


诺 伦 茶 餐 厅 调 查 问 卷 


参与 此 次 调查 的 顾客 将 获得 我 们 赠送 的 优惠 拳 ， 请 在 结账 时 索取 | 





E 








Q， 您 感觉 店内 的 就 餐 环 境 如 何 ? 
非常 不 好 不 好 


Q， 您 感觉 女 服务 生 的 制服 和 服务 态度 如 何 ? 
非常 不 好 不 好 


Q， 您 觉得 我 们 的 红茶 如 何 ? 
非常 不 满意 。 不 满意 般 
Q.， 您 觉得 价格 如 何 ? 
便宜 适中 贵 
Q， 对 于 以 下 4 种 红茶 ， 请 您 按照 自己 的 喜好 程度 进行 排序 。 





1. 原味 红茶 ( ) 位 
2. fru * ( ) 位 
3. 奶 茶 ( ) 位 
4. BRR $ ) 位 


Q， 您 喜欢 在 茶 餐厅 就 餐 四 ? 
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非常 好 


非常 好 


满意 非常 满意 

















OR & i RA hw AS 
| 对 过 于 隐私 的 问题 问 得 太 具体 。 | 
PR-RADAA 这 种 方法 行 不 通 可 以 


HALE, MKF 


起 办 法 。 会 让 受 访 者 感到 更 为 


素 切 。 


换 一 种 方法 进行 询问 ， 


与 你 的 调查 问卷 相 比 ， 


人 们 会 更 总 讳 这 种 年 





Q. 您 的 年 收入 是 ? ( 限 选 一 项 ) 


1. 400 万 日 元 及 以 下 





5. 1000 万 日 元 以 上 


我 想 了 想 ， 觉 得 
这 份 调查 问卷 不 
询问 年 收入 也 是 
可 以 的 。 


2. 400 万 日 元 以 上 600 万 日 元 及 以 下 
3. 600 万 日 元 以 上 800 万 日 元 及 以 下 
4. 800 万 日 元 以 上 1000 万 日 元 及 以 下 





您 感觉 店内 的 就 餐 环境 如 何 ? 
非常 不 好 不 好 + 非常 好 这 里 的 问题 问 得 有 点 
， 您 感觉 女 服务 生 的 制服 和 服务 态度 如 何 ? 
非常 不 好 不 好 J f 非常 好 
， 您 觉得 我 们 的 红茶 如 何 ? 
非常 不 满意 。 不 满意 满意 。 非常 满意 
您 觉得 价格 如 何 ? 


便宜 
x 


例如 “价格 如 何 ” 
这 道 题 ， 


不 知道 你 指 的 是 红茶 的 价 
格 呢 ? 还 是 蛋 炬 的 价格 ? 


还 是 尽量 询问 得 具体 
BAH! 





Q. 您 觉得 您 所 点 的 红茶 价格 如 何 ? ( 限 选 一 项 ) 
1. 便宜 2. 适 中 
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你 看 这 里 ， 这 是 1 个 问题 ， 
却 包含 两 层 意思 ? 
Q. 您 感觉 女 服务 生 的 制服 和 服务 态度 如 何 ? 
非常 不 好 不 好 — 好 


| 同一 问题 包含 两 层 以 上 的 意思 。 | 


REL BRDA MG 
态度 好 ， 而 制服 不 好 ”， 
那 他 就 不 知 该 如 何 作答 
Tt 


问题 要 一 个 一 个 
明确 地 提出 来 。 








Q. 您 感觉 女 服务 生 的 制服 如 何 ? ( 限 选 一 项 ) 
1. 非常 不 好 2. 不 好 3. 一 般 








. 您 感觉 女 服务 生 的 服务 态度 如 何 ? ( 限 选 一 项 ) 
1. 非常 不 好 2. 不 好 3. 
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Q， 对 于 以 下 4 种 红茶 ， 请 您 按照 喜好 程度 进行 排序 。 


1. 原味 红茶 ) 位 
2 柠檬 茶 ) 位 
3. 奶茶 ) 位 
4. BRR ) 位 


























那么 为 什么 不 比如 说 ， 
可 以 设计 这 样 认为 “两 者 同样 喜欢 ” 
的 问题 呢 ? 的 受 访 者 会 不 知 如 


排序 基本 上 是 在 做 
“联合 分 析 ” 


(Conjoint Analysis) 


ER, RASH AME” 
的 人 ， 也 会 苦于 它 的 位 次 
问题 。 
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问 这 个 问题 的 目的 并 不 
是 想 知道 单个 受 访 者 对 
某 一 产品 的 喜好 ， 而 是 
要 知道 整个 顾客 群 对 产 
品 的 喜好 。 


就 是 说 ， 通 过 这 个 
问题 我 们 最 终 只 要 
知道 这 样 的 结果 就 
可 以 了 ， 对 吧 ? 














这 样 的 话 ， 不 一 定 非 要 受 访 可 以 这 样 设 
者 进行 专门 排序 。 HAA- 








Q 请 在 下 列 红茶 中 ， 选 出 您 所 喜爱 的 种 类 ( 可 选 多 项 ) 





1. 原味 红茶 





2. HRR 3. 奶茶 























比例 (%) 








只 要 把 它们 加 起 来 不 ç 

ATATA? ñ 
aY] 
0 
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可 以 的 。 


如 果 没有 直接 的 代 C D / 
普 方 案 这 样 问 也 是 NS 
Ñ 





.请 在 下 列 红茶 中 ， 选 出 您 所 喜爱 的 种 类 ( 可 选 多 项 ) 
1. 原味 红茶 2 ROR 3. 奶茶 








Q2. 请 在 下 列 红茶 中 ， 选 出 您 最 喜爱 的 种 类 ( 限 选 一 项 ) 
1. 原味 红茶 2. 柠 樟 茶 3. 奶 茶 














至 于 其 他 的 建议 嘛 ， 
要 给 问题 和 选项 标明 序号 ， 


还 要 添上 “( 限 选 一 项 )” RH 
的 限制 性 说 明 。 


eres Os —— 


需要 注意 的 地 方 
这 么 多 ， 还 真是 
PIR | 


关键 在 于 要 从 “ 受 访 者 角度 ” 
出 发 ! 
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如 果 你 是 受 访 者 的 话 ， 
做 这 份 调查 问卷 会 有 什 ß 如 果 你 身边 的 人 是 受 访 者 的 话 ， |) 
感受 他 们 会 协助 你 完成 调查 吗 


2 考虑 到 这 
266, MEAT, 
J— 


D 4 
—— A 
RAM, KH 我 们 就 为 诺 伦 调查 | [4 
是 太 感谢 了 ! 调查 吧 ° 
t 4 
\ W 
gy / 天 j 
ig | 
A 








& 4. 应 当 避 免 的 问题 ( BE ) * 





上 一 节 中 ， 我 们 列举 出 了 以 下 四 类 应 当 避 免 的 问题 : 


* 对 过 于 隐私 的 事情 问 得 太 具体 
` 表达 不 明确 的 问题 

* 同时 含有 2 层 以 上 意思 的 问题 
* 排序 的 问题 


而 应 当 避 免 的 问题 还 不 止 这 些 ， 这 里 我 们 再 介绍 几 个 。 
B 诱导 回答 的 问题 





Q. 由 于 日 本 的 资源 紧缺 ， 所 以 在 21 世纪 ， 关 于 科学 技术 的 教育 越发 显得 重要 。 
因此 ， 您 对 今后 的 初中 理科 教育 有 何 看 法 ? ( 限 选 一 项 ) 








1. 应 当 再 丰富 一 些 2 保持 现状 就 好 











面 对 这 种 提问 方式 ， 很 多 人 都 是 出 于 不 得 已 而 选择 “1. 应 当 再 丰富 一 些 ” 了 。 


图 程度 等 级 太 多 的 问题 
Q， 在 您 选择 就 业 单位 时 ， 更 看 重 那 些 因 素 ? ( 每 题 限 选 一 项 ) 




















REA KR ç 有 非 极 
Steet REE $ 1 
A 不 视 重 重 重 重 
重 w 视 视 视 视 
a w 

a. 企业 知名 度 fee 2 Be 4 ax 6 DZ: 8 BO 

充分 的 人 职 教育 “i a Ee 

c. 积极 地 为 新 人 派发 工作 














或 许 是 调查 者 觉得 “用 5 个 程度 等 级 还 不 足以 分 清 受 访 者 心理 的 细微 差异 "， 所 
以 才 设计 出 了 程度 等 级 如 此 之 多 的 问题 。 正 是 出 于 这 种 想法 ， 在 实际 操作 中 ， 才 会 有 
人 认为 等 级 越 多 越 好 。 但 是 如 果 等 级 数目 不 断 增加 的 话 ， 就 会 适得其反 ， 导 致 受 访 者 
在 回答 的 过 程 中 开始 觉得 “7 也 行 、8 也 行 、 多 少 都 行 "。 
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笔者 认为 等 级 程度 最 多 有 7 项 即 可 ， 不 过 这 一 观点 并 未 得 到 学 术 上 的 证 实 ， 纯 属 
笔者 本 人 的 看 法 。 


E 评分 的 问题 





Q. 请 您 对 这 种 曲 奇 饼 口味 的 喜好 程度 进行 评分 ， 从 0 分 到 10 分 您 会 给 








分 











问题 中 并 没有 将 下 图 一 并 给 出 ， 而 且 分 数 间 的 间隔 也 没有 定义 ， 所 以 令 受 访 者 很 
难 作答 。 


—— — — — 


0 分 1 分 2 分 3 分 4 分 5 分 6 分 7 分 8 分 9 分 10 分 





此 外 ， 再 想 想 ,“0 分 ”要 如 何 解释 ， 是 要 解释 成 为 “ 难 吃 "， 还 是 要 解释 成 “ 既 
不 好 吃 也 不 难 吃 "， 读 者 在 判断 时 会 出 现 这 样 的 困扰 。 


EB 征集 自由 答案 的 问题 





Q. 请 您 列举 出 1 位 您 最 喜爱 的 艺人 。 





解答 栏 











征集 自由 答案 的 问题 有 如 下 优点 。 


* 从 受 访 者 的 角度 看 ， 如 题 所 讲 可 以 自由 回答 。 
* 从 调查 者 的 角度 看 ， 可 能 得 到 意 想不到 的 、 很 有 趣 的 答案 。 


乍 一 看 ,优点 很 明显 。 但 实际 情况 中 ， 并 不 能 如 此 随心 所 欲 地 进行 评价 。 

首先 ,请 考虑 一 下 “如 果 你 是 受 访 者 的 话 ”"。 如 果 你 是 小 学 生 或 中 学 生 的 话 ， 突 
然 被 问 到 “最 喜爱 的 艺人 ”， 你 能 立刻 回答 出 来 吗 ? 也 就 是 说 ， 当 被 问 到 不 是 那么 关 
心 的 问题 时 ， 你 能 立刻 回答 出 来 吗 ?其 次 ,请 考虑 一 下 “如 果 你 是 调查 者 "， 而 这 是 
邮寄 调查 的 调查 结果 。 
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所 有 的 数据 录 人 都 需要 你 自己 进行 。 当 拿 到 千奇百怪 的 答案 时 ， 你 就 会 意识 到 您 
所 肩负 的 工作 是 多 么 沉重 。 

先 通过 一 个 预备 调查 征集 自由 答案 ， 将 其 中 的 前 5 名 像 下 图 那样 做 成 选项 。 可 以 
用 这 种 方式 进行 调查 。 





Q. 请 您 列举 出 1 位 您 最 喜爱 的 艺人 。( 限 选 一 项 ) 
LIMFA 2. 松山 Arisu 3. RBM 4 并 木 和 人 5. 平河 栅 

















g 5“ 中 值 ”的 存在 性 ¿o 





在 进行 程度 等 级 的 评价 时 ， 无 论 采用 哪 种 方式 ， 都 会 了 “包含 “中 值 '” 和 “不 
包含 “中 值 '” 两 种 情况 。 


m 包含 “中 值 ” 








a 距 最 近 车 站 的 距离 | 1 2 S 4 5 


b. 房间 朝阳 1 2 ge 4 5 
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m 不 包含 “中 值 ” 





tray 
Earl 
Ei 
Et 





N 
w 
a 


| mnta | 1 
|. pmm fe 2 Was 4 











笔者 认为 包含 或 不 包含 “中 值 ”都 可 以 ， 但 是 不 包含 的 话 会 出 现 这 样 的 问题 ; 


“ 必须 明确 地 回答 “是 ”或 者 “ 否 "， 这 会 增加 受 访 者 的 回答 难度 。 
* 与 含有 “中 值 ”的 情况 相 比 ， 其 直方 图 与 正 态 分 布 的 相似 度 也 较 低 。 


包含 “中 值 ” 不 包含 “中 值 





如 果 为 不 知 应 当选 择 哪 种 方式 而 苦恼 那么 可 以 以 周围 的 人 为 对 象 进行 一 次 预备 
调查 试 试看 。 
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3. 旋 转 

4 特征 值 和 特征 向 量 
5. 对 称 矩 阵 

6 矩阵 的 补充 

1 离 差 平方 和 、 方 差 、 标 准 差 
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NS EA 





第 3 章 











































































m 
快 请 进 ! 快 请 进 ! 
PA 
| 
那么 今天 ， 为 了 理解 Z Q 
因子 分 析 我 们 有 必要 IAN 
先 来 学 习 一 下 数学 的 | R f 
基础 知识 Io 
请 您 多 多 指教 
Z 


Í SSS 权 且 当 作 “就 是 这 么 
我 想 今天 我 们 先 不 必 理 会 计 回 事 * 来 理解 吧 | 
算 过 程 等 问题， | L 


且 当 
$ 
只 是 讲 讲 一 些 事实 性 问题 。 Z ; 
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EE, 
RA 
$H 语 | Hie bw 858 
EE 
Ba EE 





046 017 
1 026 OMI 0.38 
0% | 059 0.97 
om 089 | 0 由 
0.3% 0.97 095 





主 对 角 线 (左上 


— — 
== es 


k zF an 


也 就 是 说 这 个 起 
阵 像 数 字 里 的 1 
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再 看 看 其 他 单位 算 阵 的 例子 吧 ! 





amn 2 和 1 列 


amin 
.[1 Offa] _ [I xa+ Oxa ‘| 


0 Ifa) [Oxa+1xXa@} |a 


ption ton smn 
0…0 1Xat+0xXa@+---+0Xa, 
1 _ Oxa+1Xa+- +0xa, _ 


Oxa+0Xa+- +1xa, 


amn ann atn 
, [1 Ofan an a 1Xan+0Xan 1Xan+0Xas = 1Xant+0Xan Ë an 


0 ljan an= dal [OXan+1Xa2 OXan+1Xan … 0Xant+lXan| [an an … 


pman rian 
a, an| ama aiX1+aax0 aiX0+azx1l a as 
10|_|mx1l+awx0 asx0+asax1|_|as an 
oij : i a g 





anXl+anX0 anX0+anXl lan an 





HALE MEM RAGE Te PETHA | 
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以 原点 为 中 心 旋转 0 角度 
后 得 到 坐标 (b, b.) 


这 个 (b,b) 就 可 以 具体 写作 


(aicos0 一 qusing, aising + a,cos0) 


TEXT 
NA hy 


Q, CaSO — Qssind | Cos@ -sin6 || a, | 
asing +a cash | | sind cos0 || a 
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求 一 下 坐标 (/3, 1) 旋转 
90” 后 得 到 的 坐标 (b, b) 


-sin90° 
Cos90° 








点 (a, a,) 旋转 日 角度 后 得 到 点 (8 及) ,具体 应 写作 (a,cos0 
一 oosinb, a,sin0 + a,cos0), 2, & (b,b) 如 果 旋转 -0 
角度 的 话 会 得 到 怎样 的 坐标 呢 ? 当然 是 点 (a,a) To 


cos(-0) -sin(- 8) |b, 
用 矩阵 的 形式 应 写作 :| nO) ao 


a 
a 





cos(- 0) -sin(- 0 |b, 
sin(-0) cos(-0)|b; 


= semanas, 如 下 所 示 : 





sin(-0) “cos(-0) 


sin(-9) cos(-Mla cos@+asin0| |sin(- Ó) cos(- 8) 


cos(- 0) arali- [cos(- 0) -sin(- Ola sosbg=wsinbg] _ [cos(- 0) - sin(- 0)| 
a= = 


sind cosôja| la 


[cos -sinñ |a, M 


请 仔细 观察 上 式 ， 


cos(-0) -sin(-0)|cos0 -singl_|10 
sin(-0) cos(-0)|sin@ 名 人 < | RARER A? 


顺便 讲 一 下 ， 下 面 两 幅 图 的 意思 是 相同 的 。 





A (b,b,) 族 转 -0 角度 
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每 个 矩阵 都会 有 与 之 对 
应 的 “特征 值 ”和 “特征 
向 量 "。 


Ql +2a, = Aa, 
30 +4a, = Aa, 








fl 2 > 
同时 ， | joanne 


那 就 先 做 个 例题 
看 看 吧 。 


就 是 4 对 的 | 人 





















































































































举 个 例子 吧 。 如 果 要 讲解 详细 计算 过 程 的 话 ,会 非常 繁琐 ， 
所 以 我 们 只 需 记 住 结论 。 





-10 6} 1)_[-10x1+ 6x2]_[2]_ f! 
“|-18 nf2|7 [-18x1 + 11x2]> [4] 12 


.[-10 6]2]_[-10x2+ 6x3]_[-2]_ [2 
-18 11|3] |-18x2+11x3| |-3| {3 


所 以 ， 由 上 可 知 2 和 -1 训 是 [8 a| et 2 对 应 的 特征 向 量 是 [| 
-1 对 应 的 特征 向 量 是 |3]。 


0 中 2x1+0x0+0x0 ' 
. =2 


040[|0=|0x1+4x0+0x0|=|0 
0 0 60} [Ox1+0x0+6x0} [0 
2 0 00] [2x0+0x1+0x0] [0 
fe sofi- fosas Saxo) =4 
0 0 60} [Ox0+0x1+6x0} [0 
2 0 O70) [2x0+0x0+0x1] [0 
-J0 sofe =|0x0+4x0+0x1 -p 
006 0x0+0x0+6x1] [6 





200 1 
所 以 ， 由 上 可 知 ，2、4、6 是 |0 4 中 ms :aa 
006 0 


0 0 
| ， communal | 


1 
0 1 


AN 
£ D 
行列 乱 阵 的 特征 值 和 符 丁 向 重 ， 原 则 上 讲 ， 存 在 组 。 . Avy 
Cee 
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但 是 这 个 要 怎样 
HEE? 





| doit T | 
是 不 是 用 Excel 
































AHKALAKE 
\ 计算 的 话 ， 过 程 
就 太 复 杂 了 。 


z 


— 
Wik 
ER, 
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"TE "Pi 


Seo Bano 0.80 | ax 023|[/2@x0ss VTX 058 V260x 0.60 
VE x\058, Voal x(-051)) VaT x, "1 Yost xogo Vozi x(-057) /03(x(-04q) 


AA oat x(-0.19) aas o| VOOR 023 008x 059 V008 x(- 0T) 


[semen nswetpinen | ARORA EM 


1 07 08 
o7 上 * 
08 09 


















如 果 这 个 例子 中 第 3 大 
特征 值 等 于 0 的 话 


oT 1 09 


08 09 | yoix080 VO3ix(-0.97) Voatx(-019) 


1 o7 08] [yas0x0ss Vslx 080 s 
| kE —— VEZ60x 058 V260x er 


Yi60x0.60 Vo3lx(-0.19) 


就 会 有 这 样 的 
RARE! 
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那 还 不 算 什么 ， 如 果 在 这 个 例子 
中 第 2 大 和 第 3 大 特征 值 都 等 于 
RBH 


07 0.8 EZ 
lad 


V260x0.58|(V260x055 /Z60<058 VZ60x 0.60) 
VZ60x060 


这 个 对 理解 因子 分 析 的 
计算 方法 ， 非 常 重要 ， 
可 一 定 要 记 好 啊 | 
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Nx = 


SS 





我 不 是 在 做 梦 
æ?! 
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š 6. 矩阵 的 补充 & 





6.1 RHES 


为 二 222 = 一 1 132) 


Mn, Nan 4 4 5 maseh — 

















x 
x 


aj 
X% 





J x+ 2x: r ha 
5]? [3x + 4m TUSE ls 4 


ux + ak ++ + dig, = by Qa Ga +. 
Xi + aks + + Qo = 
A z è 可 以 写作 |e e 


(arn + Gam + ° 


GX; + dake + ++ 
nX + nk + + s 
„Ja * om 可 以 写作 — 


An% + ant + + + Gm an ap + 
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6.2 矩阵 的 加 法 


r2 45 
pin. |) aaaf 2 am 
12] [45 
3 4]*|-24 
1+ 4 2+5 


可 以 按照 如 此 方式 3 二 (2) 4 了 4 


进行 计算 。 








an an +°. 
Qa an > 


i Gest 


Or 十 加 ant ba + 
— : Ont be pa tiba; 


lan + bp an + ba = 
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mm. a|; 
x Mig 
1 2x y 
3 4|[x y: 
“ ” Pane 12] 12 x + In 
aana m, mems h ?| 和 B ene Poke 








n+ W 
af 同时 表示 了 出 来 。 
3y + 4y: 
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例 





























t 2.3 
4 5 6k hm m 
7 8 9| h m nm| 就 是 分 别 进行 
10 11 12|[& b m m 
13 14 15 
t z 3 k + 2k + 3k 
4 5 6lk 4k + 5k + 6k 
7 8 9|k|=| Th + 8k + hl 
10 111216] |10k + llk + 12k 
13 14 15 13k, + 14k + 15k 
123 h+ 2h+ 3h 
4 5 6 人 [4 4i + 5h + 6h 
7 8 i|- Th + 8h + 9h 
10 111215] }10h + 11h + 12; 
13 14 15 13h + 14 + 15h, 
12 3 m + 2m + 3m 
4 5 6|m 4m + Sm + 6m 
7 8 9|m|=| Tm + 8m + Om 
10 11 12|[mj] [10m + 11m + 12m; 
13 14 15 13m, + 14m + 15m] 
12 3 m+ 2m + 3n 
4 5 6|[m 4m + Sm + 6m 
7 8 9|m|=| Tm + 8m + 9m 
10 11 12|m 10m + lim + 12m] 
13 14 15 13m + 14m + 15m, 
然后 再 将 以 上 结果 合并 表示 出 来 
k+ 2b + 3h l + 2h+ 3h 
4k + Sk + 6k 4+ Sh + 6b 
Tk + 8k + 9 T+ 8h+ 9h 
10k + llk + 12 10h + 11h + 125 
13k + 14k + 15k 13h + 14h + 155 
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m 
4m 
Tm, 

10m, 

13m, 


+ 2m 
+ Sm 
+ 8m 
+ Im 
+ 14m 


+ 3m; 
+ 6m 
+ 9m 
+ 12m; 
+ 15m 


10m 
13m 


+ 2m 
+ Sm 
+ 8m 
+ Im 
+ 14m 


+ 3m 
+ 6m 
+ nm 
+ 12m 
+ 15m, 












aut ke xa = Xe 
虽然 也 称 为 “乘法 "， 但 是 要 先 将 


Ch 
an 


aa an oa] 
an an … Oxl|Xn 





an ap … mfx] jl 





Xu + aX + ° + AX Qi + anxn + ++ 
nX + anxa 十 … + GX auan 十 GnXn + 
也 就 是 将 








apx + Opkut asa (anxn + Gara t+ + Oke 


Xi + Gxy + ++ + Ge 
ante + anxy 十 … 十 Gwe 同时 表示 出 来 即 可 
Xin + Oper + = + Grey 
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64 HER 
pin, [y mamas [jeres [5] os a pham, 


12 * — rar 
|; Jemen. amer | . 


12-2 1 
ash | 15 asl" 





1x(-2)+2x15 1xX1+2x(-05)]_[1 0 
3x(-2)+4x15 3x1+4x(-0.5)| |0 1 


-2 1 ]_fi ay 
因此 | 1.5 -05|=|3 4] ° 
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65 HEER 
例如 ， |: | MFD Ë 1 o 也 就 是 说 将 i | 的 行 和 列 互 换 后 得 到 的 矩阵 。 
iz i 
[5a] iotafe | | f A- 


例 








L 9: 3 1 2 3 
45 6 456 14710 13 
7 8 9 | 的 转 置 矩 阵 |7 8 9| ， 也 就 是 |2 5 8 11 14|。 
10 11 12 10 11 12 3691215 
13 14 15 13 14 15 

-3 

0 
(-3 0 8 -7 ) 的 转 置 矩阵 (-3 0 8 -7) "就 是 | 8| 。 

-7 


ün ün 


an an e°. fay an eee 


的 行 和 列 互 换 后 ， 得 到 的 | >” 


wu 
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& 7. 离 差 平方 和 、 方 差 、 标 准 差 内 





美 羽 、 理 纱 与 打工 的 同伴 们 一 起 去 唱 卡拉 OK。 她 们 每 5 人 一 组 ， 分 成 两 组 根据 
演唱 得 分 进行 比赛 。 比 赛 结果 如 下 表 。 


*#34 卡拉 OK 的 PK 结果 









































美 羽 组 理 纱 组 

(得 分 ) (得 分 ) 
美 羽 48 理 纱 67 
RF 32 BL 55 
爱 子 88 奈奈 61 
真 野 61 FJL 63 
真理 惠 n 丽 香 54 
平均 分 60 平均 分 60 

将 上 表 作成 图 便 可 得 到 下 图 。 
美 羽 组 
真理 惠 | 
Dr] [ 美 羽 | 真 野 [EF 




































































0 10 20 3 40 5 6 70 80 9 100 








+031 卡拉 OK 的 PK 结果 
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虽然 美 羽 组 和 理 纱 组 的 平均 得 分 都 是 60 分 ， 但 具体 的 情况 却 相去 甚 远 。 美 羽 组 
这 方 ,每 个 人 的 得 分 是 不 是 分 布 得 很 不 平均 呢 ? 也 就 是 说 数据 的 “分 散 程度 ”比较 大 。 

人 们 通常 采用 离 差 平 方 和 \( 总 体 ) 方 差 和 ( 总 体 ) 标 准 差 作为 表征 数据 “离散 程度 ” 
的 指标 。 这 些 指标 都 具有 如 下 性 质 : 

+ 最 小 值 为 0。 

* 数据 的 “离散 程度 ” 越 大 ， 它 们 的 值 也 就 越 大 。 


离 差 平方 和 ， 常 常会 出 现在 以 回归 分 析 为 代表 的 多 种 分 析 方法 的 计算 过 程 中 。 


离 差 平方 和 = (每 个 数据 - 平均 值 ” 相 加 之 和 


通过 上 述 计算 便 可 求解 出 离 差 平方 和 的 值 。 然 而 数据 的 个 数 越 多 ， 它 的 值 也 就 会 
变 得 越 大 ， 这 也 成 为 它 的 一 个 致命 缺点 ， 所 以 在 实际 操作 中 ， 我 们 很 少 使 用 它 作为 表 
征 “离散 程度 ”的 指标 。 

CAME) 方差 ,解决 了 离 差 平方 和 的 缺点 。 可 以 通过 如 下 计算 求 得 它 的 值 '。 


离 差 平方 和 
数据 的 个 数 


(总 体 ) 标准 差 ， 从 本 质 上 讲 与 (总 体 ) 方差 是 相同 的 。 可 以 通过 如 下 计算 求 得 
它 的 值 。 


CAMA) 方差 = 


CAMA) 标准 差 =Y( 总体) 方差 
让 我 们 来 求 一 下 美 羽 组 和 理 纱 组 的 离 差 平方 和 \( 总 体 ) 方 差 和 ( 总 体 ) 标 准 差 吧 ! 


*#32 ” 美 羽 组 和 理 纱 组 的 离 差 平方 和 、 ( 总 体 ) 方差 和 ( 总 体 ) 标准 差 

















美 羽 组 理 纱 组 
ed ee em 
= 1884 =120 
方差 1923668 P= 24 
标准 差 V366.8 = 192 24 = 49 








1. 在 方差 中 ， 也 有 不 采用 “数据 的 个 数 ”而 采用 “数据 的 个 数 -1” 作 为 分 母 的 情况 。 我 们 将 其 称 为 样本 方差 。 由 
于 箱 幅 所 限 ， 这 两 种 方差 的 区 别 在 本 书 中 就 不 做 讨论 了 。 同时 ， 在 本 书后 面 的 章节 中 出 现 的 方差 基本 上 指 的 都 是 样 
本 方差 ， 而 标准 差 也 是 指 Y 笠 本 方差 。 
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第 4 章 
主 成 分 分 析 


SS QO s 


1. 主 成 分 分 析 

2. 主 成 分 分 析 的 注意 事 

3. 主 成 分 分 析 的 具体 实 | 

4 变量 的 选择 和 第 1 主 成 分 
5. 第 1 主 成 分 和 综合 实力 

6. 累积 贡献 度 的 标准 

7. 第 2 主 成 分 及 之 后 的 主 成 分 
8. 方差 和 特征 值 












































美 油 师姐 的 房间 
好 可 爱 啊 1999 `Š RG? je if 








E 
RAR! 
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RS, Ç ? əO 
ZZZ 
Miti, ( 
这 种 分 析 方法 
叫 " 主 成 分 分 析 "。 Ñ % A 


UEN 
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— || 主 成 分 分 析 同 因 ATRL SHLAA 
成 分 分 析 吧 ? FRR ARR 样 的 错误 ， 不 如 就 借 这 个 
相似 , 很 多 人 都 机 会 先 学 习 一 下 吧 ! 
会 混 清 这 两 种 方 


法 。 









这 个 ， 还 是 你 
fite! 
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21 ERAS h 





















































顺便 说 一 下 ， 如 果 给 主 t 
成 分 分 析 增 加 一 些 约束 < 
ath, MARAE S 

相同 了 。 


这 么 相似 啊 | 


但 是 ， 反 过 来 讲 ， 如 果 不 
加 约 东 条件 ， 两 者 就 是 不 
一 样 的 。 












上 个 月 的 电影 杂志 里 就 
— SEH RE 












哈哈 ， 不 但 去 电影 院 
看 了 ， 我 还 买 7 DVD 













这 幅 图 画 的 是 去 年 公映 
的 全 部 电影 的 “观看 人 
数 ”和 “DVD HAE. 


想 想 看 ， 这 里 综 
合 人 气 最 高 的 电 






8, ka! 
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RA-A, $, RUT 
以 看 出 第 577 号 电影 的 
综合 人 气度 最 高 吗 ? 


这 条 轴 称 为 “ 主 成 分 "， 


主 成 分 上 的 各 个 个 体 的 
坐标 称 为 “ 主 成 分 得 分 "。 





就 是 这 个 分 数 玫 
跨度 最 大 的 地 方 。 
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我 们 调查 某 个 连 
锁 店 的 “投诉 件 


在 这 个 例子 中 ， 综 合 
业绩 最 好 的 店 和 最 差 
的 店 在 哪里 啊 ? 











主 成 分 分 析 的 大 体 思路 
已 经 明白 了 吧 ? 





97 








那么 ， 在 动手 做 主 
成 分 分 析 之 前 ， 还 
有 些 注意 事项 要 讲 


首先 是 第 1 点， 如 
果 用 图 来 表达 主 成 
分 分 析 的 概念 ， 会 
是 怎样 的 呢 ? 


就 拿 刚 刚 那 个 
电影 的 例子 来 说 ， 


自 变量 和 因 变 量 ? 


“MBAR fe “DVD 
销售 量 ”就 是 自 变量 
“综合 人 气度 ”就 是 因 
变量 。 
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在 主 成 分 分 析 中 ， 因 变量 
并 不 是 实际 存在 的 变量 ， 
而 是 我 们 想象 出 来 的 。 


VT 


| 


的 确 不 存在 “综合 人 
气度 ”这 个 概念 啊 ! 
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主 成 分 分 析 的 计算 方法 根据 可 分 为 非 标准 化 分 析 和 
分 析 对 象 的 数据 形式 …… 标准 化 分 析 两 类 。 





标准 化 分 析 


WARK DVD HEE 
标准 值 标准 值 
Ui Ur 


电影 | 2.7 0 








电影 742 0.9 1.2 















BAR 120 t 





标准 化 之 后 就 
会 朗 成 一 条 经 
过 原点 里 45” 
Ath, 










RAATH AYAR 一 般 说 来 ， 选 择 使 用 标准 化 
和 “DVD 销售 量 ”中 不 分 析 的 人 比较 多 。 
同 的 单位 统一 起 来 。 —Q 
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如 果 用 式 子 或 者 图 来 表示 
主 成 分 分 析 的 结构 


Z = R + Qolo + = + ApUp 


S 1 


主 成 分 自 变量 1 自 变量 2 
的 标准 什 的 标准 值 


是 各 个 自 变量 对 
主 成 分 的 影响 程度 。 


自 变量 
的 标准 值 


自 变量 记 的 标准 值 
Up 


这 个 好 像 也 没有 
什么 统一 的 名 称 





不 ， 实 际 上 能 求 出 的 主 成 分 和 
自 变量 个 数 是 相同 的 。 


第 4 点 是 关于 
主 成 分 的 个 数 。 


NOH ERK S I Zp = pith + anta +" + dtp 


不 是 只 有 1 个 轴 吗 ?了 那 就 能 求 出 个 主 成 分 。 


而 那个 “综合 实力 ”就 相当 于 
第 1 主 成 分 。 


顺便 说 一 下 ， 各 主 成 分 之 间 
是 季 直 正 交 的 。 


它们 与 分 析 者 的 意图 无 关 ， 
在 数学 上 被 自动 地 求 出 来， 
所 以 也 没有 什么 特殊 含义 。 
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Pal Ë 
好 不 容易 求 出 来 — 


的 却 还 没有 意义 。 


也 有 人 将 “第 2 主 成 分 中 的 
正 站 侧 理解 为 “高 cost 型 ， 
RF MAMA 46 cost m”. 


将 “第 3 主 成 分 中 的 正 站 侧 
理解 为 DA, AF MB 
解 为 PEA” 


,人们 强加 的 解释 。 都 是 看 到 结果 才 按照 自己 
这 都 是 享 后 人 们 强加 的 解释 ep 





NS 4 


IR 


虽然 能 求 出 的 主 成 分 和 A, 4444442 
自 变量 的 个 数 相同 ， 主 成 分 就 可 以 了 。 





但 是 ， 在 主 成 分 分 析 中 ， 
我 们 只 求 第 1 主 成 分 和 第 
2 主 成 分 ， 通 常用 二 元 数 
点 图 表示 它们 。 
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S < J 
DV A 
— 


KR tort, 
就 按照 刚才 所 讲 的 
找 个 实际 例子 


DNS 


íf 
— F! — 
来 分 析 一 下 吧 | ongan 
Z 


y 4 7 
) 
Á 
用 这 里 面 的 特刊 
RETE 
ANT 
ü SN 


V 


LA : 7 
Je Y 





这 份 特刊 中 对 “ 面 "、“ 配 
Wh” SAF tk 
了 5 个 等 级 的 评价 。 


























我 们 将 它 数值 化 之 后 ， 








x 


os o o o o 1 = ult 





wu x... -. 
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! 
对 这 些 教 据 做 主 成 分 — 44 | 


分 析 之 后 你 就 会 得 到 
“拉面 的 综合 评价 ”了 。 




















主 成 分 分 析 的 流程 
O 求 出 主 成 分 和 主 成 分 得 分 。 


O 确认 分 析 结果 的 精度 。 


@ 讨论 分 析 结 果 。 














主 成 分 分 析 的 大 致 
流程 就 是 这 样 了 。 
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求 出 主 成 分 和 主 成 分 得 分 


主 成 分 和 主 成 分 得 分 点 ， 可 以 按照 步 聚 1 到 步骤 7 的 计算 过 
程 进行 求解 。 

在 计算 的 过 程 中 ， 我 们 使 用 了 “ 拉 格 天 日 来 数 法 "， 由 于 从 数 
学 上 解释 起 来 比较 困难 ， 这 里 就 不 详细 介绍 了 。 读 者 只 需 记 
住 这 个 名 字 即 可 。 












ED tt 






































CSHG- 1s 





在 主 成 分 分 析 的 标准 化 过 程 中 ， 我 们 所 用 的 标准 差 的 分 母 ， 
通常 部 是 “数据 个 数 一 1"。 
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1 0.19 0.36][a a a 
ED 求 消 足 |019 1 030| | = Ala] 的 特征 值 2 和 特征 向 量 |o| 。 
0.36 0.30 1 Ja, a, a, 


再 对 特征 向 量 进行 单位 化 处 理 ， 即 令 其 满足 c+a+a=1 
通过 数据 分 析 软件 ， 就 可 得 到 以 下 结果 。 
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GD RESES 中 的 


` 最 大 的 特征 值 对 应 的 特征 向 量 
“第 2 大 特征 值 对 应 的 特征 向 量 


画 出 散 点 图 。 


坐标 
(0.57, -0.60 ) 
(0.52, 0.79) 
(0.63 -0.11 ) 
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ED BESE, 我们 就 可 以 得 出 第 1 主 成 分 和 第 2 主 成 分 ， 如 下 所 示 。 


057m + 0.52 + — 0.636 
= -060 + 079 - Olly 


1 t t 


“ 面 ”的 标准 值 “配料 ”的 标准 什 “ 汤 ” 的 标准 值 





最 大 的 特征 值 对 应 的 特征 向 量 就 是 第 1 主 成 分 的 系数 。 同样， 
第 mm 大 特征 值 对 应 的 特征 向 重 就 是 第 所 大 主 成 分 的 系数 。 


dH 求 出 各 样本 在 第 1 主 成 分 和 第 2 主 成 分 中 的 坐标 ， 也 就 是 说 ， 求 出 它们 
的 第 1 主 成 分 得 分 和 第 2 主 成 分 得 分 。 


第 1 主 成 分 | 第 2 主 成 分 
z 1 
07 05 
-1.0 19 
1.0 “13 
= 十 -07 
15 08 
-03 -07 
0.6 -01 
23 -0.1 
-0.7 -03 
>14 01 
0 
[6 




















144444444444 








0.57 x 1.3 +0.52 x 1.2 +0.63 x 0.1 = 1.4 
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根据 步骤 6 中 的 第 1 主 成 分 得 分 和 第 2 主 成 分 得 分 画 出 散 点 图 。 


坐标 
(07 0.5) 
C1.0, 1.9) 
(1.0, 
CLL 
CES 
(0.3, 
(06, 
(23, 
(0.7, -0.3) 
(14, 0.1) 
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| @ 确认 分 析 结果 的 精度 














那么 ， 来 确认 






主 成 分 分 析 的 成 功 与 否 ， 
是 通过 “累积 页 献 度 ” 的 
大 小 进行 判断 的 。 








那 这 个 是 3 行 3 列 ， 
所 以 和 是 3。 











刚才 在 步骤 3 
中 是 不 是 求 出 
特征 值 了 ? 





也 就 是 说 ， 每 个 变量 应 该 
分 得 的 特征 值 是 1。 
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“第 工 主 成 分 的 贡献 度 
就 应 该 是 这 样 的 。 


第 / 主 成 分 的 贡献 度 = — x 


那么 ， 累 积 页 献 度 就 是 
从 第 1 主 成 分 开始 将 
贡献 度 依次 相 加 。 


Er 


oe — 


a) | Exot È 


S x100= 204 (%) — — X100=100 (%) 


是 用 来 说 明 “ 这 个 主 成 分 
汇集 了 多 少 分 析 对 象 的 
数据 中 所 包含 的 信息 "。 
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主 成 分 分 析 中 只 求 到 第 2 
主 成 分 , 然后 画 出 散 点 图 ， 


正 因为 如 此 ， 
第 2 主 成 分 前 的 累积 贡献 
度 越 高 越 好 。 


A, HR 
有 明确 的 标准 。 


但 是 ， 还 是 希望 第 2 主 成 分 的 
累积 贾 献 率 可 以 达到 50%, 那 这 个 例题 中 是 79.6%， 
可 以 说 是 相当 好 了 | 
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| @ 讨论 分 析 结 果 





那 最 后 就 来 讨论 
一 下 分 析 结 果 吧 ! 





主 成 分 分 析 是 通过 
这 两 张 图 来 讨论 
分 析 结 果 的 。 





FIS LL —— 
在 一 起 ， 但 是 各 个 轴 的 
含义 是 相同 的 。 
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-250-20 -15 -[0 š bo 15 20 25 
—* ° TH z 


横 轴 为 第 1 主 成 分 ， 也 就 是 “拉面 的 综合 评价 "。 


再 来 看 看 变量 图 ° 
CETA 也 就 是 说 , 对 “拉面 的 综合 评价 ” 
4 影响 最 大 的 变量 是 “ 汤 "。 
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上 方 是 不 是 
HA FOR N? 


第 2 主 成 分 的 信息 
也 是 可 以 利用 的 





下 方 的 “地 回 "， 


它 的 面 不 也 得 
到 相应 的 评价 
137 





117 















š 4. 变量 的 选择 和 第 1 主 成 分 <° 





这 个 就 算是 求 出 “拉面 的 
综合 评价 ”了 吗 ? 









虽说 是 这 样 ， 可 还 
是 有 点 担心 …… 





要 是 求 “拉面 的 综合 评价 ”的 话 ， 


不 是 应 该 再 加 上 “价格 "、“ 份 量 ” 
之 类 的 才 对 吗 


要 多 考虑 一 些 其 他 的 


变量 后 ， 再 来 做 主 成 
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我 们 将 通过 “ 面 "、" 配 料 …、 
“Hh” 这 3 个 变量 推导 出 的 
第 1 主 成 分 定义 为 “拉面 的 
综合 评价 "， 这 种 作法 

始终 有 点 主观 。 2 
那 该 怎么 办 


在 主 成 分 分 析 中 ， 主 成 
分 分 析 的 对 象 的 选择 

也 就 是 “变量 的 选择 ”以 及 
“第 1 主 成 分 的 定义 "， 


都 是 需要 分 析 者 
自行 判断 的 。 


以 这 个 为 例 吧 。 


补习 班 离 家 近 的 孩子 ， 下 课 后 不 用 在 路 上 耽搁 时 间 ， 这 样 就 会 有 较 多 的 时 间 用 于 复习 ， 学 习 
成 绩 就 应 该 好 。 我 们 在 对 “语文 "、“ 社 会 "、“ 理 科 ”"、“ 英 语 ” 和 “数学 ”进行 主 成 分 分 析 时 ， 应 
该 加 上 “从 家 到 学 校 的 距离 的 倒数 ”这 一 自 变量 ， 再 将 所 得 的 第 1 主 成 分 定义 为 “综合 成 绩 ”， 


才 更 为 妥当 。 
从 家 到 学 校 
语文 | 社会 | = 数学 的 距离 的 倒数 


42 62 26 20 1/1200 
12 28 42 84 1/580 
































119 


PRAHA 这 样 认为 
HE, 也 是 可 以 的 啊 ! 
里 还 要 加 入 从 家 到 \ 


补习 班 的 距离 ? 


不 会 是 什么 都 可 以 用 


来 做 主 成 分 分 析 吧 如 果 不 详细 说 明 


为 何 要 用 这 些 变 重 进行 分 析 
那 结果 能 令 
周围 的 人 信服 吗 ? 























也 可 以 说 ， 这 是 一 种 
与 分 析 者 关联 性 很 强 
的 分 析 方法 。 
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以 前 去 你 家 
HHR, À 





们 聊 过 的 | 
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内 5. 第 1 主 成 分 和 综合 实力 & 





在 此 前 的 讲解 中 ， 我 们 认为 第 1 主 成 分 一 定 能 够 表示 “综合 实力 "。 但 事实 并 非 
如 此 。 
请 思考 下 面 的 例子 。 下 表 中 记录 的 数据 ， 是 对 某 中 学 3 年 级 学 生 的 调查 结果 。 


*#41 调查 结果 的 数据 





理科 

(分 ) 
A 7 
B 68 
C 9 
D 100 
D 75 








对 这 组 数据 进行 主 成 分 分 析 ， 可 以 求 出 它 的 第 1 主 成 分 是 : 


Z = 0.56u + 0.60u, + 0.57u 


t ! | 
"理科 的 数学 的 。 RPR 
标准 值 标准 什 的 标准 值 


那么 ， 这 个 第 1 主 成 分 究竟 表示 哪 种 综合 实力 呢 ? 只 要 用 常识 性 思维 去 想 一 下 ， 
就 知道 它 不 能 表示 任何 综合 实力 。 
再 举 个 例子 。 如 果 要 用 主 成 分 分 析 来 判断 您 的 “综合 运动 能 力 ”。 那 么 就 有 ， 


O 无 论 是 “握力 ”还 是 “最 喜爱 的 电视 节目 "， 无 论 什么 变量 都 不 假 思索 地 
进行 收集 。 

@ 对 这 些 变量 进行 主 成 分 分 析 。 

按照 这 样 的 顺序 求 出 的 第 1 主 成 分 ， 怎 么 能 表示 您 的 “综合 运动 能 力 ” 呢 ? 
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人 收集 计算 “综合 运动 能 力 ”的 相关 变量 。 
@ 对 这 些 变量 进行 主 成 分 分 析 。 


要 是 按照 这 样 的 顺序 求 出 第 1 主 成 分 ， 不 就 能 表示 您 的 “综合 运动 能 力 ” 了 吗 ? 

总 之 ， 并 不 是 说 只 要 做 了 主 成 分 分 析 ， 所 求 出 的 第 1 主 成 分 就 自然 表示 综合 实 
力 。 分 析 者 要 依据 所 要 探求 的 “综合 XX 实力 "， 收 集 相 关 变量 ， 并 对 这 些 变量 进行 
主 成 分 分 析 ， 只 有 这 样 才能 说 所 得 到 的 第 1 主 成 分 表示 “综合 XX 实力 ”。 也 就 是 说 ， 
以 烹饪 炖 菜 为 例 ， 并 不 是 说 “只 要 将 萝卜 、 青 椒 以 及 其 他 手边 所 有 能 找到 的 食材 都 放 
进 锅 里 炖 ， 就 自然 能 做 出 炖 菜 "， 而 是 “ 豪 包 者 依据 所 要 做 的 炖 菜 ， 收 集 相应 的 食材 ， 
再 进行 烹饪 ， 只 有 这 样 才能 做 出 炖 菜 ”。 

附带 说 一 下 。 

将 足够 的 另 吐 粉 、 泡 菜 和 钳 鱼 干 放 在 一 起 炖 ， 您 就 做 出 炖 菜 了 。 那 个 真 的 是 炖 菜 
吗 ? 当然 ,您 硬 要 说 “这 就 是 炖 菜 ! ”也 没关系 。 但 是 ， 您 周围 的 人 坚持 认为 这 和 炖 
菜 还 差 得 远 呢 ， 非 但 如 此 ， 还 会 惊讶 地 看 着 您 说 :“ 你 这 家 伙 在 说 什么 胡 话 呢 ? ”到 
底 如 何 炖 才 是 真正 的 炖 菜 呢 ? 不 是 至 少 要 放 多 少 鲍鱼 干 ， 更 何况 这 也 没有 一 个 统一 的 
答案 ， 而 是 要 靠 厨师 的 聪明 才智 来 判断 ， 这 样 解释 起 来 才 较 为 妥当 。 以 上 所 说 的 情况 
同样 适用 于 第 4 节 “ 变 量 的 选择 和 第 1 主 成 分 "。 











& 6. 累积 贡献 度 的 标准 & 





正如 之 前 所 说 的 那样 ， 主 成 分 分 析 的 结果 通常 用 二 元 散 点 图 来 进行 表示 。 因 此 ， 
只 要 第 2 主 成 分 前 的 累积 贡献 度 的 值 足够 大 ， 就 可 以 比较 确定 地 认为 ， 这 个 散 点 图 汇 
集 了 相当 多 的 分 析 对 象 的 数据 中 所 包含 的 信息 。 我 们 就 会 自信 地 认为 “这 个 分 析 很 
成 功 ”。 

遗憾 的 是 ， 像 “第 2 主 成 分 前 的 累积 贡献 度 达到 XX% 以 上 ， 就 认为 这 个 分 析 是 
成 功 的 ”这 样 的 统计 学 标准 并 不 存在 。 在 114 页 出 现 的 “50%” 那 个 所 谓 的 标准 ， 其 
所 基于 的 观点 就 是 “如 果 没有 汇集 到 一 半分 析 对 象 的 数据 中 所 包含 的 信息 ， 那 这 个 散 
点 图 就 很 难说 是 有 意义 的 "， 这 也 只 不 过 是 笔者 自己 的 想法 。 
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下 面 再 提出 一 个 可 能 令 读者 困惑 的 问题 。 首 先 ， 请 您 以 任意 两 个 变量 为 对 象 进行 
主 成 分 分 析 。 您 就 会 发 现 第 2 主 成 分 前 的 累积 贡献 率 一 定 是 100%。 接 下 来 ， 再 请 您 
以 200 个 变量 为 对 象 进行 主 成 分 分 析 。 只 要 不 是 一 定量 的 数据 ， 第 2 主 成 分 前 的 累积 
贡献 度 的 值 是 不 会 达到 50% 的 。 由 此 可 见 ， 第 2 主 成 分 前 的 累积 贡献 度 的 值 是 否 能 
达到 50%， 很 大 程度 上 是 依赖 于 分 析 对 象 的 变量 个 数 的 。 

虽然 说 在 实际 操作 中 并 不 存在 累积 贡献 度 的 标准 ， 但 要 知道 它 的 标准 并 不 是 随意 
的 。 一 般 不 会 有 人 见 到 “第 2 主 成 分 前 的 累积 贡献 度 的 值 为 14%” 这 样 的 分 析 结果 后 ， 
还 对 此 分 析 持 肯定 态度 。 毕 竞 分 析 者 也 不 好 意思 让 周围 的 人 看 到 这 样 的 分 析 结果 。 

笔者 建议 您 在 按照 本 章 的 内 容 进行 分 析 的 同时 ， 努 力 找到 适合 具体 情况 的 标准 。 


& 7. % 2 主 成 分 及 之 后 的 主 成 分 & 


如 果 读 者 并 不 是 很 关心 数学 原理 的 话 ， 可 以 跳 过 本 节 内 容 ， 不 做 阅读 。 

我 们 之 前 讲 过 ， 第 2 主 成 分 及 之 后 的 主 成 分 和 分 析 者 的 意图 无 关 ， 是 在 数学 上 自 
动 地 被 求 出 来 的 。 其 实 ， 这么 说 也 并 不 恰当 。 

KRE, 第 2 主 成 分 是 分 析 者 在 下 述 前 提 的 约束 下 求 出 来 的 轴 '。 





+ 同 第 1 主 成 分 垂直 正 交 。 
* 通过 数据 方差 第 2 大 ( 仅 次 于 第 1 主 成 分 ) 处 的 轴 。 


实际 上 , 第 3 主 成 分 是 分 析 者 在 下 述 前 提 的 约束 下 求 出 来 的 轴 *。 


+ 同 第 1 主 成 分 和 第 2 主 成 分 垂直 正 交 。 
* 通过 数据 方差 第 3 大 ( 仅 次 于 第 1 主 成 分 和 第 2 主 成 分 ) 处 的 轴 。 


也 就 是 说 ， 第 2 主 成 分 及 之 后 的 主 成 分 ， 并 不 是 “和 分 析 者 的 意图 无 关 ， 是 在 
数学 上 自动 地 被 求 出 来 的 "， 而 应 当 是 “在 分 析 者 加 入 了 前 提 约 束 下 求 出 来 的 "， 分 析 
者 如 果 不 加 约束 就 求 不 出 来 了 。 


1. 换 句 话说 ,第 2 主 成 分 是 “ 先 要 同 第 1 主 成 分 垂直 正 交 ， 并 且 通 过 数据 方差 第 2 大 处 的 轴 ”。 
2 换 句 话说 ,第 3 主 成 分 是 “ 先 要 同 第 1 主 成 分 及 第 2 主 成 分 垂直 正 交 , 并 且 通 过 数据 方差 第 3 大 处 的 轴 ”。 同 样 地 ， 
第 i 主 成 分 就 是 “ 另 一 个 垂直 正 交 的 主 成 分 并且 通 过 数据 方差 第 i 大 处 的 轴 ”。 
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也 许 读者 会 认为 ， 分 析 者 不 必 刻 意 去 提醒 自己 “要 加 约束 条 件 "， 使 用 数据 分 析 
软件 自然 就 可 以 将 第 2 主 成 分 及 之 后 的 主 成 分 求 出 。 事 实 的 确 如 此 ， 数 据 分 析 软件 在 
一 开始 便 加 入 了 之 前 所 讲 的 那些 约束 条 件 ， 然 后 才 进行 计算 的 ， 这 样 做 看 上 去 多 此 一 
举 ， 但 却 是 一 个 非常 符合 实际 情况 的 方法 。 








& 8. 方差 和 特征 值 & 





如 果 读 者 并 不 是 很 关心 数学 原理 的 话 ， 可 以 跳 过 本 节 内 容 ， 不 做 阅读 。 

正如 之 前 所 讲 ， 第 1 主 成 分 是 “通过 数据 方差 最 大 处 的 轴 "。 请 您 根据 这 句 话 再 
观察 一 下 第 107 页 到 第 111 页 中 主 成 分 分 析 的 计算 过 程 。 但 在 求解 第 1 主 成 分 时 ， 有 
关 数 据 方差 的 计算 并 没有 完全 给 出 ， 取 而 代 之 的 却 是 如 何 计算 特征 值 和 特征 向 量 的 有 
关内 容 。 

事实 上 ,“ 求 出 通过 数据 方差 最 大 处 的 轴 ” 同 “ 求 出 相关 矩阵 中 最 大 的 特征 值 所 
对 应 的 特征 向 量 ” 是 一 回 事 ， 这 一 点 我 们 在 数学 上 暂且 不 做 详细 介绍 。 同 样 地 ,，" 求 
出 通过 数据 方差 第 ;大 处 的 轴 ” 同 “ 求 出 相关 矩阵 第 ;大 特征 值 所 对 应 的 特征 向 量 ” 
也 是 一 回 事 。 
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1 因子 分 析 | 

2 .因子 分 析 的 注意 事项 | 

3 因子 分 析 的 具体 实例 | 

4 本 章 例子 中 的 样本 | 

.补充 注意 事项 | 

6 因子 载荷 量 小 的 变量 人 | T 
的 处 理 方法 [Ps eu 

zaxe 上 | 一 一 

8. 旋转 与 vimax 法 ”| | 

9 FROU THERE 

10. Promax 法 

11, 能 够 假定 的 公共 因子 个 数 的 上 限 

12. 主因 子 法 和 Varimax 法 真 的 过 时 了 吗 

13. 因子 分 析 中 的 术语 


AN 































今天 就 要 讲 露 儿 你 期 待 
已 久 的 因子 分 析 路 ! 








请 你 多 多 指教 ! 



















































































010 
K 
ÈO 
Dole 
za 





JAF 
$ gl J j 这 回 就 用 那 份 调查 问卷 
因子 分 析 ， 不 过 ， Koen 


然后 再 动手 做 一 下 因子 
分 析 ， 

我 想 把 之 前 

RIE T—&LE 


做 出 来 的 诺 伦 调查 问卷 
再 重新 做 一 下 1! 






Š 
Aha 

Yj; | 
D j 


KR, DEL 
你 要 加 油 啊 | 
































Z 1. 因子 分 析 & 


这 里 有 比较 好 的 
数据 。 


Š 





获得 专业 的 
O| Aoki 
saa [enze 学 、 进 修 | Aa, 























A 
B 
c 
D 
E 
F 
G 
H 
I 
J 
K 
L 
M 
N 
o 





这 个 表 是 对 全 国 大 三 学 生 
进行 的 关于 “选择 就 业 单 
位 时 所 关注 的 事项 ”的 调 
查 结果 ， 分 5 个 评分 等 级 。 





什 起 大 就 衣 示 起 重视 . 
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看 一 下 A 君 的 数据 。 


在 “是否 可 以 提高 个 人 能 力 " 的 
相关 问题 给 出 了 较 高 的 评分 。 


是 有 志 于 去 大 企业 吧 1 
在 “工作 是 否 稳定 ”的 相关 
问题 中 给 出 了 较 高 的 评分 。 


D68556. 


在 "是 否 注重 实践 能 力 ” 
的 相关 问题 给 出 较 高 
评分 。 


你 对 数据 相当 
BET | 


—A 
学 来 的 虽 7 





人 与 人 之 间 的 能 力 必然 有 所 差异 ， “在 
选择 就 业 单位 时 所 关注 的 事情 "会 受到 
以 下 “3 种 起 法 ”的 影响 : 

.个 人 能 力 是 否 能 够 得 以 提高 

+ LHRERR 

“ 是否 注 重 实 路 能力 


你 刚刚 是 不 是 这 样 起 的 呢 ? 


圳 儿 刚 出 是 不 是 \ 
这 


样 想 的 
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这 是 某 个 补习 班 上 高 三 学 生 的 
5 门 课 的 测验 结果 


我 们 再 来 举 一 个 

















es mommuoaw> 














像 刚才 一 样 来 讨论 
一 下 这 些 数据 吧 | 











A 和 B 文 村 类 的 


— 同 刚才 的 例子 。 ”人 与 人 之 间 的 能 力 不 同 


想法 一 样 。 


会 受到 以 上 两 方面 
， 这 么 说 没 错 吧 ? 




















们 之 间 是 不 是 
可 以 说 存在 着 
这 样 的 关系 ? 


用 这 些 虚 构 的 东西 
来 解释 数据 也 没 关 


据 的 特征 进行 合理 的 > 


— 
e, 
ed 


x ` 
BAAN, 
Rite 
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“3 个 想法 "、 文科 能 力 "、 YY 只 不 过 是 隐藏 在 数据 背后 的 
“理科 能 力 "这些 想 象 的 自 变 量 轨 了 。 


产物 并 非 一 定 不 存在 ， 


RH, With a, 
在 数据 背后 的 自 变量 找 
出 来 的 分 析 方法 ， 





顺便 讲 一 下 ， 第 i 个 自 每 个 个 体 中 的 公共 因子 的 
变量 被 称 为 “第 i 公共 具体 值 被 称 为 “因子 得 分 "。 
因子 ”或 者 “第 因子 ” 


文科 能 力 | 理科 能 力 








ATRAER, AMER 
先 来 明确 一 下 因子 分 析 和 
主 成 分 分 析 的 差别 。 











像 这 样 ， 无 论 是 思考 
方法 还 是 结构 图 都 完 
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2. 因子 分 析 的 注意 事项 & 


借 着 刚刚 的 话题 ， 
我 们 来 讲 讲 因 于 
分 析 的 注意 事项 。 


主 成 分 分 析 的 
各 主 成 分 存在 
着 这 样 的 含义 。 


对 于 因子 分 析 的 各 公共 因子 来 
说 并 不 存在 这 样 的 固有 含义 。 


A, AMT HH 
子 就 能 看 出 来 ， 


这 些 可 都 是 非 讲 不 可 的 啊 ! 








各 公共 因子 的 含义 只 
能 是 在 做 完 分 析 之 后 ， 
由 分 析 者 主观 地 进行 


推断 。 bappa maa 


< 
指 的 就 是 “文科 能 力 ” 
和 “理科 能 力 ” 
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但 是 ， 在 因子 分 析 中 并 没有 
这 样 的 排序 ， 各 公共 因子 地 


在 主 成 分 分 析 中 ， 存 在 Ñ 
着 这 样 的 顺序 : 

“第 1 主 成 分 “第 2 主 
成 分 " 


因子 分 析 的 计算 ， 难 点 在 
于 分 析 者 必须 在 分 析 前 先 
假定 出 公共 因子 的 个 数 。 


要 在 分 析 前 想象 出 隐藏 
着 几 个 公共 因子 ， 这 简 
直 是 不 可 能 的 啊 | 
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BRAD 个 公共 因子 
















































































就 像 这 样 先 假定 个 基数 
有 多 种 可 能 ， 然 后 依次 
对 各 种 情况 进行 分 析 ! 





总 的 来 说 

存在 着 这 样 一 个 数学 标准 
“将 公共 因子 的 个 数 假定 为 
‘PKG pI 大 的 
特征 值 的 个 数 "。 


























还 好 
不 是 体力 活 …… 
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Feta; 对 同一 组 数据 进行 分 


SHERPA 新 时 ， 无 论 公共 因子 
l 是 2 个 还 是 3 个 ， 有 
几 种 假定 就 会 得 到 几 





同 刚才 的 注意 享 项 有 
£, Tat. 












AK 
X08088 








a, 
那 到 底 用 哪个 来 作 最 
终 的 结果 才 好 呢 ? 






这 样 做 可 以 吗 ? 
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受 计算 方法 所 限 


虽然 说 隐藏 着 多 个 公共 
因子 ， 但 实际 上 


因此 ， 分 析 者 可 以 大 胆 
地 断定 ， 公 共 因子 中 能 
够 有 名 字 的 也 只 是 几 个 
而 已 ， 除 此 以 外 就 只 能 


称 为 “其 他 因子 ”了 。 








在 因子 分 析 中 公 
共 因子 的 个 数 最 
多 也 不 会 超过 自 
变量 的 个 数 





到 此 ， 因 子 分 析 的 
原理 图 就 可 以 这 样 
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实际 上 ， 还 要 再 加 上 这 些 相当 
于 “其 他 因子 ”的 东西 ， 这 样 
做 才 比 较 合适 。 


DI 


这 个 @, 就 是 所 谓 的 
“其 他 因子 " 吧 ? 








> 
<Á 














了 点 ， 
在 因子 分 析 的 计算 中 ， Ņ 
通常 要 对 分 析 对 象 的 
要 对 分 析 ; 所 以 从 现在 起 就 
数据 逐一 进行 变量 以 这 个 为 计算 的 
标准 化 。 —E 前 提 。 
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用 式 子 或 者 图 形 来 表示 
因子 分 析 的 结构 …… 
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一 种 分 析 者 连 想 

都 不 用 想 ， 公 共 

因子 就 会 自动 浮 

taal 
! 





你 会 这 么 想 是 很 


自然 的 。 


这 种 情况 下 公共 因子 
也 无 法 提取 出 来 





N 在 因子 分 析 中 ， 因 MA 
就 算 你 不 认为 这 变量 的 选 定 是 解决 
里 隐藏 着 公共 因 > 问题 的 关键 。 


子 也 是 正常 的 。 
























































an! | Š 
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MMA, Mik ik B) 
变量 的 背后 隐藏 着 这 样 的 





只 有 当 这 个 假设 在 一 定 程度 
上 成 立时 ， 因 子 分 析 才 能 顺 


À ` 不 能 事先 预测 出 一 
不 正 是 因为 不 知道 隐藏 — KÉ 定 程度 的 结果 ， 就 
着 什么 样 的 公共 因子 才 A 不 能 进行 有 效 的 分 
要 做 因子 分 析 的 吗 ? 析 


实际 上 ， 因 子 分 析 并 
不 是 为 了 找 出 背后 隐 
藏 的 公共 因子 的 分 析 
方法 。 
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它 是 为 确认 “因子 载 
荷 量 ” 的 值 而 设计 的 
分 析 方 法 ， 就 是 我 们 
在 讲 第 8 点 注意 事项 
时 曾 提 到 的 “因子 载 


U = A fi tAn fa + e, 
Wa ASi + dof + & 
We Ah + On fr +e; 
Wa Wut + deh +e, 
W= Oa fit Oxf. + e, 


因子 载荷 量 的 结对 值 越 大 ， 
我 们 就 可 以 解释 为 “这 个 公 
共 因子 对 相应 的 因 变 重 的 形 


那么 ， 就 按照 我 们 所 学 的 
知识 一 起 来 做 一 份 适用 于 
因子 分 析 的 调查 问卷 吧 ! 











欢迎 光临 ! ) 交 3. 因 了 分 析 的 具体 实例 守 | 一 
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SS 7 
NR NS 顾客 调查 问卷 。。、 
N AT 
` Wu Ca 
SN BAT AEH Om 
Bo Omega mg yy 
N | Ia x _ | 
s= |E Ene Ë 
| 
hugi ————— 


(tise E 


R ART 
AMIRAH FE! 























pan — 
fe AM Se 


tanata” ee 
|= Cette 1 


的 吗 ? 
teens! 














We 
N 


今天 15 时 到 
peeryer! 
店 的 客人 做 的 回 
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E 关于 本 店 的 问题 
Q1. 请 问 您 对 杰 店 的 印象 如 何 ? ( 腿 先 一 项 ) 


这 份 调查 问卷 中 由 6 个 
问题 组 成 了 “ 诺 伦 的 


— 
RRS 





HR ERR BK, ROL 


“因子 载荷 量 的 什 


AART! PN 


“就 是 对 诺 伦 的 业 方 面 进行 评价 ” 
这 样 的 公共 因子 7. 








Qle 
红茶 的 价格 





oÁzzgrxm--=omxmoom> 



































=a — 对 于 这 些 数 据 ， 假 定 有 2 个 公共 因子 
然后 进行 因子 分 析 。 








Z w S Y wv V X 9 














O 求解 旋转 前 的 因子 载荷 量 。 

















@ 求解 旋转 后 的 因子 载荷 量 。 








加 解释 各 公共 因子 的 含义 。 





O 确认 分 析 结果 的 精度 。 















@@ 求 出 因子 得 分 ， 充 分 理解 每 个 个 体 的 特征 。 





| 
| r ia 


M, HOLM \ 
要 做 “旋转 " 吗 ? N3 
ó: 
4 
N 








* 





| O 求解 旋转 前 的 因子 载荷 量 。 





首先 来 求 旋转 前 的 





Z 
因 于 载 符 量 的 计算 方法 有 YZ — ———— 
“主因 子 法 "、“ 极 大 似 绑 法 ” J 
很 多 种 方法 。 
SN 
来 吧 ， 让 我 们 奋勇 E 
向 前 ! 
Á 










按照 步骤 1 到 
DH 16 的 顺 
序 来 计算 。 = 
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逐一 进行 变量 标准 化 。 





Qla 店 面 | .| QIf 茶 杯 的 
i 美感 


2 





á 


flozzcnc-zommoow> 





A 
B 
c 
D 
E 
F 
G 
H 
I 

J 

K 
L 
M 
N 
0 

平均 





_ 平均 | 35 aut z 
m| m | 一 
(5-3.5) +.+(2-3.5) _ 
—— : “12 


























因子 分 析 中 的 变量 标准 化 ， 所 用 的 标准 差 的 分 母 通常 
为 “数据 的 个 数 -1"。 
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GD 。 将 款 准 化 之 后 的 数据 假定 为 如 下 


假定 方 框 方差 为 1。 





QIf 的 

















平均 
标准 差 





























假定 平均 值 为 0、 方 差 为 di。 





假定 平均 值 为 0、 方 差 为 do。 





如 果 用 图 来 表示 A 的 数据 ， 便 会 得 到 以 下 结果 。 





















































Raw 
注意 事项 8 中 的 
RIERA 
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a= 

假定 : 

S Rl e 的 单 相关 系数 是 0 
SA e 的 单 相关 系数 是 0 
SF e, 的 单 相关 系数 是 0 
所 和 ,的 单 相关 系数 是 0 
SF e, 的 单 相关 系数 是 0 
帮 和 ,的 单 相关 系数 是 0 
太 和 的 单 相关 系数 是 0 
太 和 ,的 单 相 关系 数 是 0 
三 和 ,的 单 相关 系数 是 0 
Sf, Alle, PK ABE 0 
Sf Ale, 的 单 相关 系数 是 0 
SF e, 的 单 相关 系数 是 0 


e, ft 的 单 相关 系数 是 0 
e, Rl e, 的 单 相关 系数 是 0 
e, fl e, 的 单 相关 系数 是 0 
e, 和 ,的 单 相关 系数 是 0 
e, 和 ,的 单 相关 系数 是 0 
6 和 ,的 单 相关 系数 是 0 
e, 和 ,的 单 相关 系数 是 0 
e, Rl e, 的 单 相关 系数 是 0 
,和 ,的 单 相关 系数 是 0 
,和 ,的 单 相 关系 数 是 0 
e, Rl e, 的 单 相关 系数 是 0 
e, 和 ,的 单 相关 系数 是 0 
e, Rl e, 的 单 相关 系数 是 0 
e, fll e, 的 单 相关 系数 是 0 
e, 和 ,的 单 相 关系 数 是 0 


假定 “公共 因子 和 独 
立 因子 "、“ 独 立 因子 
之 间 ” 是 不 相关 的 。 








换 句 话说 ， 就 是 
f fl e, 的 离 差 积 和 


= faen + ** + faeo 
=0 





例如 : EA A e, 的 单 相关 系数 的 值 为 0， 也 就 是 说 


太 和 ,的 离 差 积 和 _ 
Y WB: PRI xe, A 


= (Ma-JNeu-8) + + (fa-FXex-8) 
= (0(en-0) + + (-0Xes-0) 
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GP 人 恨 定 /和 /的 单 相关 系数 的 值 为 0， 也 就 意味 着 


三 和 上 太 的 离 差 积 和 
T RETNA xf Ree 一 











换 句 话说 ， 就 是 


人 和 上 的 离 差 积 和 
= + + -I-T 
= (fa - Ofi- 0) + + (É - 0) - 0) 
= fafat = + ab 

=0 





“任意 两 公共 因子 之 间 的 单 相关 系数 的 值 为 零 "， 这 种 假定 的 思 
考 方法 被 称 为 正 交 因子 模型 。 不 作 这 种 假定 的 思考 方法 则 被 称 
为 斜 交 因子 模型 。 








之 前 ， 由 于 “计算 相对 简单 "这 一 原因 ， 人 们 通常 先 设想 成 
正 交 因 子 模型 再 进行 分 析 。 但 是 现在 ， 随 着 计算 机 性 能 的 不 
断 进 步 ， 而 且 “任意 两 公共 因子 的 单 相关 系数 的 值 为 0"， 这 
样 的 假设 本 来 就 没有 什么 现实 依据 。 


所 以 ， 设 超 成 儿 交 因子 模型 的 分 析 也 洒 渐 开始 被 人 们 接受 。 
这 个 例子 中 我 们 以 正 交 因 子 模型 来 分 析 。 
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EÐ mun, srpus or 的 标准 值 u, 和 O1f 的 标准 值 w 的 单 相关 系数 写成 以 下 
形式 ， 请 您 思考 这 一 过 程 并 进行 确认 。 


u, All u, 的 离 差 积 和 
V u, 的 离 差 平 方 和 xu, 的 离 差 平方 和 





志和 MBEAN 
= REET A xu HAAI PROMI AB HCA 


Uy Fil u, 的 离 差 积 和 
cain wate BAT tahu Oem 
S EI y 32 














wu 的 离 差 平方 和 
15-1 15-1 





w Ru A EAN 
_ t flu, 0882288 
15-1 


= fat anfa + em)(Gof + aofia + es) + ++: + (aufn + anf + eo as + asaj + eo) 
T 





(anfa + anfa + en) aufa + anfa + eu) + --- + (anfi + anfa + e) asfi + anfa + eo) 


=laafadafa + aa fadafa|t\anfrlu|+ asfoas fa + dnfadafal+|dnfaes4+ Cndafil } enaafdHene, 
+ — igs —— Selon eon dap + eo eon 


= anda(fat---+fe) + anaal fafa + + fifa) + aul fen + + + frea) 
+anda(fafat +--+ af) +andal(fat--+fa) — +anm(fes-+ - + frlos) 
+aa(fient+ + freer) +aalfoent = +feea) 十 (eaew 十 … 十 emeog 
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= aoa( 太 的 离 差 平方 和 ) +asas( f, 和 所 的 离 差 积 和 ) +as( fi ft e, 的 离 差 各 和) 
+ asas f RL 82288) +asae( 太 的 离 差 平方 和 ) +as( f; ft e, 的 离 差 积 和 ) 
taf Ale, REBA) +as( f; ft WRB) +(e, ft e, HARA) 

= awas (f 的 离 差 平方 和 )+0 Ta 
+40 +asas( f EFA) +0 | 
H “0 ee 





_ anaa( 的 离 差 平方 和 Jandal f, AFA ) 

* 15-1 

x ARAPA 
15-1 


s ny INE DE 





= Ado 
= qungux( 斤 的 方差 Handa f, WITH ) 
= ava,tasas 


确认 一 下 因 变 量 之 问 
的 关联 程度 就 可 以 了 








ELD mam T u 和 的 单 相关 系数 改写 成 以 下 形式 ， 请 您 思考 这 一 过 程 并 
进行 确认 。 
志和 的 离 差 积 和 
Vu RIE A xu, IEG A 





u, All u, 的 离 差 积 和 


15-1 
` RETIN xu PTH | EAU ORAS 














也 和 弛 的 高 差 积 和 
ws 的 方差 


— el eka 
* = 
2 i RATE = RE", RS RIERA 
_ 1 Rl u, ENOL 
15-1 


= u, WATE 





— (au + anfa + en)? + +++ + (anfi + anfa + eo)? 
J 15-1 


(anfa + anfa + en)? + --: + (auf + anfa + ex) 
= | (ashi)? Hank) +|(ee) +] 2(aaf0(asfo) |+ 2(asfo)(es) |H 2(ea(aafu) 





+ | (Gabi)? Hla + (Con) H 2G arabs) Hla en) H2 (eX anb) 


= an(fit-+fa) +a2(fat -+ fa) + (Cat + ea) 
+2anda( fafa +--+ fifa) + 2an(faea + -= +fr€or) +2an(fuen + -= + flor) 
=a (f EM) +a( 太 的 离 差 平方 和 ) He 的 离 差 平方 和 ) 
*2axax( f, Af, SEEM )+20,( f fl e, 的 离 差 积 和 )+2au(i Al e, HAZE ) 
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Gf EIA yta 的 离 差 平方 和 He, 的 离 差 平方 和 pee 


_ Ga f AYALA ta f, AY BESET He 的 离 差 平方 和 ) 
> 15-1 


x 的 离 关 平方 和 px LEBET , o 的 离 差 平方 和 
— 1-1 2 15-1 15-1 








= hlf ATH )ranx( f, WITH He 的 方差 ) 
-end SD 





eama exman annaa 
(orn) maa wawaq. 
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GD sees 和 步 紧 6 可 知 ,可 以 将 相关 矩阵 改写 成 以 下 形式 ， 请 您 思考 这 一 
过 程 并 进行 确认 。 
n| [a +as+ dl awasqa + anas+ anao 
me| _ |ewaa tasas ah+ah+ di Ands + anda 


rej [asas + anan dsan + agan … aà + abq+ d 


antah Mantaua … anaa+aoae| [d? 0 
_|@nditand: aitah + Gna + anae , | 0 di 


quant+ aaan asqa aaan + — aà +ah 0 0 


GD 生理 步 桶 7 中 的 式 子 。 在 计算 的 过 程 中 出 现 的 、 等 式 左边 主 对 角 线 上 的 
1-2 被 称 为 共性 方差 ， 有 时 记 作 “ 友 ”。 


qh+ah Anan + a ands + anqa 
_|awaatanaa dita + ands + anqa 


Asan + aaan eid + aaan = ah + ah 


ah+ab — anas+ anan … Ande + anqa 
—lawaatanaa ah+ah + ands + anqa 


aqu + aaan Asian + aaan … Qh + ah 


2 
Ta os ta anas+ anam ` 
2 2 
m l- _|anan+aaaa aht ah 


anās + Ande 
ands + anaa 








h ma c Vd} [aan tana asqa+aean … a+ ah 
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ah +a 
J + ana 


aaan + aaan 


anan + anan 
= [0an + anan 


dsan + Gols 


[an an 
+ š 

i illa: 
da aa, 


a an 
_ aa a 


+ 1-d| |an ae 


aant anan + 
— dudes + Onder 


antah 


Gedy + anan + 


Anant anan --* 
anā anan = 


ago 十 Gaga + 


aaa as + 


Gn 十 gage 


二 


iyi + Odea 
nasi + anaa,| 


dade, + dads 























国 侧 的 计算 已 经 结束 了 ， 
接 下 来 是 @ 侧 的 计算 。 
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d 0 
由 分 析 对 象 的 数据 来 求解 实际 的 相关 矩阵 ， 再 减 去 | 0 < 


1 0.65 0.80 0.11 
0.65 1 059 0.02 
0.80 08 1 0.02 
0.11 0.02 0.02 1 
0.01 0.19 0.04 0.82 
0.14 0.01 0.10 0.77 0.64 


l-d? 0.65 0.80 0.11 001 0.14 
0.65 1-d 089 0.02 0.19 0.01 
0.80 0.89 1-di 0.02 004 0.10 
[O11 0.02 0.02 1-d 082 0.77 
0.01 0.19 0.04 0.82 1-di 0.64 
0.14 0.01 010 077 064 1-d; 





B eR Ei] 
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EED Po PEM et, 也 就 是 共性 方差 1-d WERA, REMF: 


1-d= 以 为 因 变量 、 以 、、u、u、u 为 自 变量 的 重 回 归 式 的 贡献 率 民 
Lede DA u, DRZE, u, u, ` u, 为 自 变量 的 重 回归 式 的 贡献 率 民 
1-d- Du, SHB, Dlu u, ` u, 为 自 变量 的 重 回归 式 的 贡献 率 到 
1-d DA u, SUPE, Vu, u, 为 自 变量 的 重 回归 式 的 贡献 率 R 
1-d 以 uw 为 因 变量 、 以 u、 u, 为 自 变量 的 重 回归 式 的 贡献 率 R 
1- Uh u, SEE, BL u, ` u, Jy EYEE AUER TEAR R 








1-di 065 0.80 011 0.01 0.14 0.68 0.65 0.80 0.11 0.01 0.14 
0.65 1-d 0.59 0.02 0.19 0.01 0.65 0.88 0.89 0.02 0.19 0.01 
0.80 0.89 1-d 0.02 0.04 0.10] 080 0.89 0.91 0.02 0.04 0.10 
0.11 0.02 0.02 1-di 0.82 0.77] |0.11 0.02 0.02 0.81 
0.01 0.19 0.04 0.82 1-di 0.64 0.01 0.19 0.04 0.82 
0.14 0.01 0.10 0.77 0.64 1-di] [0.14 0.01 0.10 0.77 








从 数学 上 讲 ， 如 果 我 们 不 假定 共性 方差 1-d 的 值 ， 接 下 来 的 
计算 就 无 法 进行 。 

关于 如 何 假定 共性 方差 1-d 的 值 ， 存 在 着 许多 方法 。 其 中 比 
较 著名 的 一 种 ， 便 是 上 面 我 们 所 提 到 的 这 种 方法 。 








as 
了 了 = AK + ark+--+4,x,+B 


Carmnsews, con 
REZRKE, Fit 
具体 介绍 还 是 看 看 我 过 前 的 





1. 请 参照 《漫画 统计 学 之 回归 分 析 》 第 三 章 。 
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D 


0.68 0.65 0.80 0.11 0.01 0.14 
0.65 0.88 0.89 0.02 0.19 0.01 
0.80 0.89 0.91 0.02 0.04 0.10 b 
0.11 002 0.02 0.81 0.82 0.77 3 的 特征 值 A 和 特征 向 量 & 
0.01 0.19 0.04 0.82 0.81 0.64 ts 
0.14 0.01 0.10 0.77 0.64 0.66, bs 


求 满足 | 


RETA, BIH + e+ b+ e+ 6 +6 = 1。 


通过 数据 分 析 软 件 ， 就 可 得 到 以 下 结果 。 








在 这 个 例子 中 , 实际 上 应 该 求 出 6 组 特征 值 和 特征 向 重 。 但 是 ， 
第 3 大 及 其 以 后 的 特征 值 和 特征 向 量 ， 在 之 后 的 内 容 中 不 会 出 
现 ， 我 们 就 不 做 特别 介绍 了 。 
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ED HI 大 及 其 以 后 的 特征 值 看 作 0， 以 下 的 关系 依然 成 立 。 请 您 思考 这 
一 过 程 并 进行 确认 。 
0.68 0.65 080 0.11 001 0.14 
0.65 0.88 0.89 0.02 0.19 0.01 
0.80 0.89 0.91 0.02 0.04 0.10 
0.11 0.02 0.02 0.81 0.82 0.77 
0.01 0.19 0.04 0.82 0.81 0.64 
0.14 0.01 0.10 0.77 0.64 0.66 


V25x04 V2.11x(-028) 
V255x048 ¥2.11x(-034) 
_|v255x050 /211x(-038))/255x 043 v255x 048 V255% 030 ¥255x034 255x034 /255x03) 
=l 055x034 Jax osi [y2I1x(-028) Y2I1x(-034) ¿LH x(C039 V211X051 V211x047 V211x04 
2555034 /LllX 047 
255x032 V211x 043 


0.64 0.72 0.77 0.07 
0.72 0.83 0.88 0.05 
0.77 0.88 0.94 0.03 
0.07 0.05 0.03 0.85 
0.10 0.08 0.06 0.81 
0.10 0.08 0.06 0.74 











Crk ee Mae Cae ee a ae aed 
上 的 值 。 


0.80 0.11 0.01 
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0.64 0.65 0.80 0.11 0.01 0.14 h 
0.65 0.83 0.89 0.02 0.19 0.01 h 
0.80 0.89 0.94 0.02 0.04 0.10 b 
Rie 0.11 0.02 0.02 0.85 0.82 0.77 & 的 特征 值 4 和 特征 向 量 tf 
0.01 0.19 0.04 0.82 0.77 0.64 ts 
0.14 0.01 0.10 0.77 0.64 0.64 ts be 


PERRET AACA, ISH + 8+ 8 ++ 8+ 6 = 1, 


通过 数据 分 析 软件 ， 就 可 得 到 以 下 结果 。 


REA ERE , BR 
出 特征 值 和 特征 向 量 | 
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QD wee 中 矩阵 的 主 对 角 线 上 没有 任何 一 个 值 ， 也 就 是 没有 任何 一 
个 共性 方差 1-d 的 值 超过 1， 那么 循环 操作 步 又 12 Bjb 14, TER 
12 中 有 任何 一 个 共性 方差 1- 必 的 值 超过 1 为止。 


VAX VAX ta an 

VAxi VaXte| |an 

将 最 后 一 个 循环 p| VAX ta VA: X to bap pe as 
a VAXta VA: X te ay 
VA Xt Var Xto as 

VAxin Vaxta] las 





在 这 个 例子 中 ， 由 169 页 结果 可 知 ， 还 需 在 进行 一 轮 步 又 12 到 步骤 14， 在 接 下 
来 的 一 轮 中 的 步骤 12 中 的 共性 方差 1-d 的 值 超过 1。 所 以 将 上 一 页 的 


V2.55 xX0.42 Y2.11X(-0.28) a 

V2.55 x0.47 v2.11 X (- 0.34)! an 

v2.55 X0.50 v2.11 X (- 0.40)! an Ti w 
V2.55 XxX0.36 Y2.11X 0.52 看 作 as as 也 就 是 说 可 以 得 出 如 下 结论 ， 
V2.55 x0.35 V2.11x 0.46 as 

V255x032 Y2.11X 0.42 a 





VAXt VAxa] [/254x042 V2.11X(-0.28) 
VA Xt VAX ta 254x047 V2.11x(-0.34) 
a |VA xt VAL x ta} -|Y254x050 2.11 x(-0.40)| _ 
VAXta VAxta| |/254x036 V211x 0.52 | 
VA Xt VaXta| |V254x035 V211x 0.46 
VAX tr VAX ter 254x032 V2.11X 0.42 
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a, as 将 步 邓 15 前 求 出 的 
an a j FRA EIR At 
ë A 坐标 ， 画 出 散 点 图 。 


au an 
“DF RHEE HK 
“因子 模式 矩阵 "。 
Qib. AACR 


1 Z h Qie 女 服务 生 的 服务 态度 
n 2 Qla. 红茶 的 味道 

ir Sy 4 | die 红茶 的 价格 

N — 人 


Qla. 店面 设计 





QIf 茶杯 的 美感 


是 ! 

这 个 就 是 旋转 前 的 

因子 载荷 量 了 1! 
。Q2d. 红茶 的 味道 

。*Q2e. 红茶 的 价格 

Q2f. 茶杯 的 美感 


06 08 10 / 


。Q2a. 店面 设计 
* Q2b. 店内 气氛 
“Q2c. 女 服务 生 的 
服务 态度 











@ 求解 旋转 后 的 因子 载荷 量 





接 下 来 ,经 过 “旋转 ” 

之 后 公共 因子 的 含义 
解释 起 来 就 容易 多 \ 
T! 


以 原点 为 中 心 
改变 轴 的 位 置 










大 致 可 以 分 为 " 正 交 旋 转 " 和 "“ 斜 交 旋转 "。 





BREATBEBER, RRCATMFEBER, 





ERRR @ q 


+ Varimax 法 ` Promax 法 

* Quartimax 法 * Quartimin 法 

+ Biquartimax 法 + Biquartimin 法 
+ Oblimin 法 





同时 ， 每 种 旋转 方法 又 可 
分 为 这 些 类 型 。 


正 交 旋 转 中 ， 最 著名 的 
是 Varimax 法 ， 也 称 最 
大 方差 正 交 旋 转 法 。 
斜 交 旋 转 中 ， 最 著名 的 
则 是 Promax 法 。 
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今天 ， 我 们 就 来 讲 所 有 旋转 
方法 中 最 著名 的 Varimax 法 。 


根据 这 个 因子 载荷 量 息 阵 
我 们 可 以 得 到 这 个 式 子 


Qu Qn 067 -04[ 


Qa ra|[Qu Q … 中 om -04 067 074 … | 
È las Ax = : [-041 -049 … 060 


Qa 05| 060 
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067 0.74 … 
-0.41 -049 … 


0.51 
0.60| 


067 0.74 … 
041 -049 … 


He 


oosC -sin(- 8) 
sin(-0) cos(-0) 


cos O 
sind 








0.60 


-0.41 
-0.49||eos(-0) -sin(- 0| 


sin(-0) cos(- 0) 


-041 
Bra | 


cos sind) 
-sing cos} 


sin 
[0.67 xcosO-(~0.41)xsind 067xsin0+(-041)xeos0| 
{0.74 x cos REVOKE 0.74x sind + (- 0.49) x cosh | 


ostxoos0- 060 Xsing Osi xsind+ 0.60 xeosb 


| 


bu ba 
lon a|, 
5|: | 


ia as 
ba e 
ba 





176 第 5 章 因子 分 析 


| sind 


cosð -sing| 
cos) 


| -全 


-sing 
cos | 


067 074 … 
-0.41 -049 … 


067 074 … 
-041 -049 .. 


0 ud 0.51 


cos) 


067 0.74 … 
-0.41 -049 … 


0.51 


067xensb-(C040)Xsnb 074Xxoosb-(-049)Xsianb ~ 
[067 xsind + (-041)xeos 074xsnb+(-049)xeosb ~ 


°| -D 
ool D 


| ears 


= 051 xcos0- 0.60. sind 
= 051 X sinĝ + 0.60 x cos | 





它 和 因子 载荷 重 和 矩阵 ， 也 就 是 
an as] [067 -041 
0.74 -0.49 
GW Ga 


没有 什么 区 别 。 


by bz] [0.67xcos0-(-0.41)xsing 0.67 xsind + (- 0.41) x cos 
a 7. = (- 05 inĝ 0.74xsin0 + (- 0. 
bu bal lo 4 x cos 8 [ 0.49) x sind 0-74xsind + ( 0.49)X cos0| ye nIRREER, 


ba ba 0.51Xxcosg- 0.60 xsin0 0.51xsinĝ+ 0.60 xcos@0 


要 是 这 样 的 话 ‘ae 


到 底 哪个 才 是 真正 的 
因 于 载荷 重 短 阵 呢 ? \ 


' 


a an 
au ga 只 不 过 
da da 
是 日 角度 为 0” 时 的 
od (asheosd -errsal Stead atxced) 
o @ (hve -Orsa , Sring Olbea) 
© S (asxewt -aoi , OSixsnb+ ild: cet) 


ih 
1 Clomewe-(as)sat, Qi0rsag+ (-05%)rcesf) 


H —E 
以 (areug-( 的 jsmg) axab+(edjrepg) 
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AA Varimax 法 ， 拿 这 个 例子 来 说 ， 吉 是 
“第 1 公共 因子 的 因子 载荷 量 平方 ”的 离 差 
平方 和 同 “ 第 2 公共 因子 的 因子 载荷 量 平方 ” 
的 离 差 平方 和 相 加 。 


具体 讲 ， 这 个 方法 就 是 
HH OR, RA 
角度 刚好 可 令 此 式 子 的 


(si Sit bis + bi) + oa 


+ [s bit bit +b ) 


Kuas. ka m. m=] 


刚才 讲 的 是 原始 Varimax 法 。 
话 虽 如 此 ， 实 际 上 Varimax 
法 可 分 为 "原始 Varimax 法 "和 “ 标 
准 化 Varimax 法 ”两 种 


目前 ， 通 党 所 说 的 Varimax 法 
指 的 是 标准 化 Varimax 法 。 
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— — 
| bi Bh aa 3 | bh Bit tatba 
ba + bi 6 bà + bè 6 





bay. bb 
bù _ B+ bb Bi + be 
bi + ba 6 


bè ( 
bi bint bš 2 | 4... 
B+ bh 5 — 





标准 化 Varimax 法 就 是 
将 轴 旋 转 0 角 ， 而 这 个 
角度 刚好 可 令 上 面 这 个 
式 子 的 值 最 大 。 


鉴于 这 个 计算 过 程 相当 
麻烦 ,这 里 就 略 去 不 讲 ， 
不 过 结果 是 这 样 的 。 


0.67 x cos(- 36") ~ (-0.41)xsin(-36°) 0.67xsin(-36)+(-041)Xcos(-367) 


bi b: 
0.74 x cos(- 36°) — (- 0.49) x sin(- 36°) 0.74 x sin(- 36°) + (- 0.49) x cos(- 36°)| _ |0. 


by ba 


0.51 Xcos(-36")- 0.60 xsin(-36°) 0.51 xsin(-36°)+ 0.60 Xcos(-36°) 


ba ba 


对 这 组 数据 来 说 ， 只 要 
旋转 -36” 其 含义 解释 哈哈 ! 这 个 就 是 


起 来 就 最 为 容易 了 1! NE 旋转 后 的 因子 载 
CE BERET. 
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i 4 

画 成 图 就 是 这 样 的 。 i 
i ` fo Q2d 红茶 的 味道 
H * Qe. 红茶 的 价格 
: 。Q2f 茶杯 的 美感 


哈 1 果然 


* Q2a. 店面 设计 

。Q2b. 店内 气氛 

Q2c. 女 服务 生 的 
服务 态度 





























ER 





顺便 说 一 下 ， 如 果 是 
有 4 个 公共 因子 的 情 
吏 就 按 这 个 顺序 对 其 
中 的 2 轴 进 行 旋转 。 
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@ 解释 各 公共 因子 的 含义 








HL, Bisa T 
因子 载荷 量 的 值 





那 我 们 就 把 刚刚 所 





求 出 的 因子 载荷 量 a= 
的 值 中 ， Qla. 店面 设计 


QIb. 店 内 气氛 2 


Qic. 女 服务 生 的 服务 态度 | 098 
A aa a Qld .红茶 的 味道 
— Š Qe. 红茶 的 价格 


QIf 茶杯 的 美感 





在 讲 注意 享 项 时 曾经 提 到 过 ， -其 一 I 


AF RREG ARK HE, aN 
“这 个 公共 因子 对 相应 的 辐 变 。 [ONIN Z) x 
量 的 影响 也 让 大 月 D 3— 


以 0.5 为 目标 。 


























一 个 对 “店面 设计 "、 F 另 一 个 对 “红茶 的 味道 ”、 
格 `、 


“店内 气氛 ”、 “红茶 的 价 
“ 女 服务 生 的 服务 态度 ” “茶杯 的 美感 ” 
影响 较 大 。 影响 较 大 ， 所 以 
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“ 诺 伦 的 印象 ”背后 所 隐藏 的 
是 对 “店内 或 餐 环 境 ” 和 


是 


eo 
š. i < 
— | 


还 没 确认 分 析 结果 的 
精度 呢 ， 之 后 还 要 求 出 
因子 得 分 呢 ! 


















那么 ， 你 来 确认 一 
下 这 些 分 析 结果 
是 否 可 信 吧 1 








由 个 变量 组 成 的 
相关 矩阵 的 特征 值 
之 和 就 是 p， 你 还 


所 以 ， 同 主 成 分 分 析 一 
样 ， 因 子 分 析 的 成 功 与 
否 也 是 通过 累积 贡献 度 
的 大 小 进行 判断 的 。 


但 是 ， 同 主 成 分 分 
析 中 贡献 度 的 定义 
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记得 ! 
每 个 变量 应 该 分 得 的 
特征 值 是 1 吧 ? 



































拿 眼 前 的 这 个 例子 来 说 ,， “第 j 
公共 因子 的 贡献 度 ” 就 是 这 样 


2 


b+ ba +bi +ba+b +b 
6 


第 i 公 共 因子 的 贡献 度 = +x100 


从 第 1 公共 因子 起 
将 贡献 度 依次 相 加 
不 就 得 到 累积 贡献 
度 了 吗 ? 


具体 的 计算 过 程 就 是 这 样 | 





第 1 公共 因子 i 259 10039 9 (4) 234 too=39 8 (%) 





第 2 公共 因子 226 226 «(00=39.7 (8) B + 236 x (00m 74 (1) 


你 看 这 个 累积 话 虽 和 如此， 分析 者 这 回 是 77.4%， 
贡献 度 还 变 大 还 是 希望 在 “其 假 所 以 ， 也 就 是 说 
定 公共 因子 的 个 我 们 的 分 析 是 成 


数 ” 前 可 以 达到 


但 是 ， 像 “累积 贡献 度 达到 XX% 
以 上 ， 就 认为 这 个 分 析 是 成 功 的 ” 
这 样 的 统计 学 标准 是 不 存在 的 。 





185 





| @ 求 出 因子 得 分 ， 充 分 理解 每 个 个 体 的 特征 








那么 ， 最 后 就 来 求 
“因子 得 分 " 吧 上 


AN 
DIANNA 只 要 求 出 因子 得 分 的 话 就 能 了 解 这 
各 个 个 体 中 公共 因子 的 具体 值 ， 次 协助 我 们 进行 问卷 调查 的 顾客 特 


你 还 记得 吗 ? 


































































































因子 得 分 的 计算 方法 有 / “2 | ! Was 
“回归 法 ”( 回 归 估 计 法 )、 ts 
“Bartlett 法 "、 
“Anderson-Rubin 法 ”等 等 ， 
但 是 今天 我 们 只 介绍 最 著名 
的 回归 法 。 


























好 的 1 
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在 因子 分 析 最 那么 ， 用 回归 法 来 
初 计算 时 这 样 因 于 得 分 的 计算 方 
做 过 。 RA ARF de 
Sy 就 是 这 样 。 Vy 
73 


7 






































具体 的 计算 过 
程 就 是 这 样 ! 











12 -0.7 =06 





注意 一 下 第 1 公共 


我 们 来 看 一 下 总 的 





因子 的 因子 得 分 ， 


HARI? 


A 
B 
c 
D 
E 
F 
G 
H 
I 
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第 1 公共 因子 
fi 


第 2 公共 因子 


fi 





A 
B 
c 
D 
E 

F 

G 
H 
1 

J 

K 
L 
M 
N 
o 


1.38 
1.27 
0.28 
0.34 
-0.45 
1.20 
1⁄2 
-1.60 
-0.68 
-1.61 
-0.62 
0.24 
-0.64 
0.24 
-0.56 


0.24 
-1.19 
0.49 
-0.30 
-0.35 
-0.56 
0.78 
1.03 
-0.53 
=-1.11 
-1.97 
0.29 
0.83 
112 





这 样 一 来 ， 我 们 就 可 
ARA OLARAK 
环境 ” 持 有 最 住 印象 。 




































































因子 分 析 























同样 的 道理 ,你 再 Y 
来 解读 一 下 第 2 公 V 
































到 此 ， 
因子 分 析 的 学 习 
也 就 结束 了 。 






































189 





怎么 会 ? 
工作 应 该 不 会 
这 么 快 就 结束 啊 







































































































































































































































































































(QI ALY 
2 
+, 有 哈哈 ， 
ACM BART = 真 对 不 起 。 


hae 人 A 





& 4. 本 章 例子 中 的 样本 < 





在 本 章 的 例子 中 总体 和 样本 是 如 下 定义 的 : 





总 体 所 有 光临 诺 伦 的 顾客 
样本 x 月 x 日 15 时 至 16 时 之 间 ， 参 加 美 羽 和 露 儿 所 进行 的 问卷 调查 的 全 体 顾客 











无 论 怎 么 说 ， 这 些 样本 都 不 能 算是 通过 无 作为 抽样 法 抽出 的 样本 ， 而 是 由 美 羽 和 
露 儿 根 据 自己 的 随意 判断 所 进行 的 有 意 抽样 法 抽出 的 样本 。 

第 一 章 曾 讲 过 “如 果 样 本 不 是 “总 体 的 精确 缩影 ”就 没有 意义 了 ”"， 可 是 在 介绍 
本 书 的 主要 内 容 一 因子 分 析 时 ， 怎 么 会 举 出 了 一 个 与 其 相 矛盾 的 例子 呢 ? 这 肯定 会 
给 一 些 读者 带 来 疑惑 。 也 许 您 会 认为 这 是 强 词 夺 理 ， 不 过 在 市 场 营销 等 领域 进行 数据 
分 析 时 ， 上 述 情况 确实 是 不 可 避免 的 。 也 就 是 说 , “本 来 是 通过 有 意 抽样 法 得 到 的 样 
本 ， 却 将 它 假设 成 是 通过 无 作为 抽样 法 得 到 的 样本 进行 分 析 "， 这 种 情况 是 不 可 避免 
的 。 如 果 不 这 样 做 的 话 ， 不 用 说 因子 分 析 ， 几 乎 什么 分 析 都 没有 办 法 进行 。 

“本 来 是 通过 有 意 抽样 法 得 到 的 样本 ， 却 将 它 假设 成 是 通过 无 作为 抽样 法 得 到 的 
样本 进行 分 析 "， 如 此 做 法 ， 笔 者 认为 ， 只 要 不 是 太 混 乱 不 堪 的 样本 ， 并 且 事先 对 周 
围 的 人 讲 明 具体 情况 ， 在 实际 操作 中 也 是 允许 的 。 但 是 在 学 术 研究 中 ， 是 不 是 也 允许 
这 样 做 呢 ? 允许 与 否 ， 还 要 请 您 仔细 留意 样本 的 形成 过 程 ， 再 做 决定 。 
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& 5. 补充 注意 事项 & 





以 下 总 结 了 从 139 页 到 149 页 之 间 所 讲 过 的 因子 分 析 的 注意 事项 。 



































注意 事项 1 各 公共 因子 的 含义 ， 只 能 是 在 做 完 分 析 之 后 ， 由 分 析 者 主观 地 进行 推断 。 

注意 事项 2 同 主 成 分 分 析 中 的 各 主 成 分 有 所 不 同 , 各 公共 因子 是 平等 的 , 排序 不 分 先后 。 

注意 事项 3 对 于 因子 分 析 的 计算 ， 分 析 者 必须 在 分 析 前 先 假定 出 公共 因子 的 个 数 。 

注意 事项 4 对 同一 组 数据 进行 分 析 时 ， 对 于 公共 因子 的 个 数 有 几 种 假定 就 会 得 到 几 种 
分 析 结果 。 这 时 使 用 哪 种 结果 作为 “最 终 的 分 析 结果 "， 就 要 根据 分 析 者 自 
己 的 喜好 而 定 了 。 

注意 事项 5 虽然 说 在 因子 分 析 中 ， 可 以 隐藏 着 多 个 公共 因子 ， 但 是 受 计算 方法 所 限 ， 实 
际 操作 中 公共 因子 的 个 数 最 多 也 不 会 超过 因 变量 的 个 数 。 

注意 事项 6 (图 形 所 占 空间 过 大 ， 因 此 省 略 ) 请 参见 143 页 。 

注意 事项 7 在 因子 分 析 的 计算 中 ， 首 先 要 对 分 析 对 象 的 数据 逐一 进行 变量 标准 化 。 

注意 事项 8 (图 形 所 占 空间 过 大 ， 因 此 省 略 ) 请 参见 145 页 。 

注意 事项 9 实际 上 ， 因 子 分 析 并 不 是 一 种 不 需要 分 析 者 思考 ， 公 共 因 子 就 会 自动 浮现 
的 魔法 般 的 分 析 方法 。 

注意 事项 10 | 因子 分 析 是 为 了 确定 因子 载荷 量 的 值 而 存在 的 分 析 方法 。 





对 于 这 些 注意 事项 ， 下 面 做 几 点 补充 。 





EIN 1 的 补充 


没有 什么 需要 特别 补充 的 。 





注意 事项 2 的 补充 
没有 什么 需要 特别 补充 的 。 





分 析 者 一 定 要 在 分 析 之 前 假定 出 公共 因子 的 个 数 。 虽 然 听 起 来 有 些 荒 雇 ,但 因子 


注意 事项 3 的 补充 


分 析 确实 是 这 样 进行 的 。 


事实 上 ,所 假定 的 公共 因子 的 个 数 是 有 其 数学 上 的 标准 的 。 就 是 141 页 所 讲 的 “ 相 
关 和 矩阵 中 大 于 1 的 特征 值 的 个 数 "。 此 外 ， 还 相当 于 “在 Scree Plot (WAR) H, ih 
线 变 缓 前 的 特征 值 的 个 数 "。 所 谓 Scree Plot 就 是 将 特征 值 由 大 到 小 依次 列 出 后 画 出 


的 折线 图 。 
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在 一 般 的 介绍 因子 分 析 的 书 中 ， 大 体 上 都 会 给 出 上 面 所 讲 的 这 段 文字 。 不 过 ， 笔 
者 还 是 犹 珍 ， 只 是 为 了 所 谓 的 “标准 "， 便 把 “特征 值 的 个 数 "“ 数 学 上 ”这 样 的 话 
拿 出 来 讲 , 这样 做 是 否 合适 。 但 是 ， 如 果 不 想 得 复杂 些 ， 只 是 像 第 141 页 所 讲 的 那样 ， 
先 假定 各 式 各 样 的 公共 因子 的 个 数 ， 再 随意 地 做 各 种 形式 的 分 析 ， 这 样 做 又 是 不 切实 
际 的 。 





项 4 的 补充 


同 之 前 所 讲 的 注意 事项 3 相 比 ， 这 个 注意 事项 4 更 为 重要 。 

分 析 者 根据 自己 的 喜好 来 决定 “最 终 的 分 析 结果 "， 对 此 可 能 有 的 读者 会 想 “ 这 
么 做 可 以 吗 ?” 

实际 上 , 还 是 有 一 些 正 规 的 方法 可 供 我 们 使 用 的 , 比如 用 以 下 这 些 方法 来 确定 “最 
终 的 分 析 结果 ”会 比较 合适 。 


' 以 “相关 矩阵 中 大 于 1 的 特征 值 的 个 数 ”为 公共 因子 个 数 时 的 分 析 结果 。 

+ 以 “在 Scree Plot( 碎 石 图 ) 中 ， 曲 线 变 缓 前 的 特征 值 的 个 数 ” 为 公共 因子 个 
数 时 的 分 析 结果 。 

+ 以 “累积 贡献 度 的 值 达到 一 定 程度 ' 时 特征 值 的 个 数 ”为 公共 因子 个 数 时 的 分 
析 结 果 。 

` 以 “ 拟 合 优 度 检验 * 中 失去 意义 的 个 数 ” 作 为 公共 因子 个 数 时 的 分 析 结果 。 

“ 以 “ 拟 合 优 度 指标 ”的 值 达到 最 佳 的 个 数 ”作为 公共 因子 个 数 时 的 分 析 结果 。 


不 过 ， 至 少 就 笔者 的 经 验 看 来 ， 我 们 不 能 过 于 依赖 这 些 方法 。 也 就 是 说 ， 我 们 不 
能 过 于 期 待 以 下 这 种 情况 会 发 生 。 


先 假定 公共 因子 的 个 数 为 2>、3、4， 或 者 其 他 ， 而 后 随意 进行 分 析 。 总 觉得 3 个 公共 因 


子 的 情况 最 适合 作为 分 析 结果 。 再 查看 一 下 此 时 的 相关 矩阵 中 大 于 1 的 特征 值 的 个 数 ， 正 好 
是 3。 到 底 是 正规 方法 啊 ， 果 然 信 得 过 。 











1 笔者 所 谓 的 “一 定 程度 ” 指 的 是 “50%"。 
2 稍 后 再 对 “ 拟 合 优 度 检验 ”进行 介绍 。 
3.“ 拟 合 优 度 指标 ”本 书 不 作 介绍 。 
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分 析 者 根据 自己 的 喜好 来 决定 “最 终 的 分 析 结 果 "， 笔 者 这 么 说 毕竟 还 是 有 些 言 
过 其 实 。 但 是 尽管 如 此 ， 我 们 也 不 要 过 分 依赖 现在 所 讲 的 这 些 正规 的 方法 。 结 论 还 是 
要 视 分 析 者 自己 的 判断 而 定 。 


至 少 在 我 们 所 见 到 的 ， 使 用 Varimax 法 或 Promax 法 旋转 来 进行 因子 分 析 的 过 程 
中 ， 所 能 假定 的 公共 因子 个 数 是 有 上 限 的 。 详 细 内 容 以 后 再 讲 。 


注意 事项 6 的 补充 
没有 什么 需要 特别 补充 的 。 


注意 事项 7 的 补充 


没有 什么 需要 特别 补充 的 。 








注意 事项 8 的 补充 





在 第 4 章 的 开篇 时 我 们 曾 讲 过 ， 主 成 分 分 析 和 因子 分 析 是 两 种 不 同 的 分 析 方 法 。 
尽管 如 此 ， 恶 怕 还 是 会 有 一 些 软件 将 主 成 分 分 析 和 因子 分 析 混为一谈 ， 存 在 同样 误 
解 的 人 也 不 在 少数 。 请 您 再 看 一 下 138 页 的 图 。 无 论 怎样 ， 都 不 会 有 “ 主 成 分 分 析 = 
因子 分 析 ” 的 情况 。 


在 第 148 页 中 我 们 曾 讲 过 ， 对 于 因子 分 析 来 说 ， 只 有 当 “ 这 些 因 变 量 背后 应 该 隐 
藏 着 这 样 的 公共 因子 ”这 一 假设 在 某 种 程度 上 成 立时 ， 因 子 分 析 才 能 顺利 进行 。 换 名 
话说 ， 只 要 这 个 假设 越 接近 实际 情况 ， 那 么 ， 分 析 顺利 进行 的 可 能 性 ， 即 推导 出 分 析 
者 想 要 的 结果 的 可 能 性 也 就 越 高 。 这 样 看 来 ， 因 子 分 析 这 种 分 析 方法 比较 像 大 家 所 说 
的 “没有 悬念 的 比赛 ”'。 


1. 硬 要 说 成 “放水 的 比赛 ”又 有 些 不 妥 ， 但 不 管 怎么 说 ,因子 分 析 者 往往 通过 因子 分 析 产 生出 对 自己 有 利 的 结果 ， 
这 是 目前 因子 分 析 的 实际 情况 。 
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在 做 因子 分 析 时 ， 一 定 要 对 调查 问卷 中 的 问题 仔细 推荐 。 不 过 ， 即 便 是 仔细 推荐 
过 ， 所 得 到 的 结果 还 是 会 令 您 惊讶“ 这 是 什么 啊 ”"。 所 以 说 这 是 一 种 万 不 可 麻痹 大 意 
的 分 析 方 法 。“ 手 边 刚好 有 最 近 做 过 的 问卷 调查 的 数据 ， 就 凑合 着 用 这 个 吧 ”， 存 在 类 
似 这 种 想法 的 话 是 绝对 做 不 好 因子 分 析 的 ! 





注意 事项 10 的 补充 


一 般 情 况 下 ， 我 们 大 概 会 像 如 下 所 述 的 那样 对 因子 分 析 进行 定义 。 


` 通过 少数 几 个 公共 因子 来 说 明 因 变量 之 间 的 相关 关系 的 分 析 方法 。 
* 找 出 背后 所 隐藏 的 公共 因子 的 分 析 方法 。 


笔者 对 于 哪 一 种 定义 都 不 是 十 分 认同 。 为 什么 呢 ? 首先 ， 拿 前 者 来 说 ， 确 实 让 
人 觉得 这 是 一 个 在 数学 上 很 妥当 的 定义 ， 但 除非 是 “ 独 具 慧 眼 之 人 ”， 否 则 那些 有 生 
以 来 第 一 次 见 到 这 个 定义 的 人 ， 还 真 难免 不 会 领 首 认同 “确实 如 此 "。 再 拿 后 者 来 说 ， 
正如 之 前 注意 事项 9 中 所 讲 的 那样 ， 因 子 分 析 可 谓 是 一 场 “没有 悬念 的 比赛 ”， 所 以 
很 明显 这 个 定义 是 不 正确 的 。 但 是 ， 我 认为 将 直观 上 非常 容易 理解 的 定义 作为 学 习 因 
子 分 析 的 “第 一 步 " 也 并 非 是 一 件 坏事 。 

笔者 将 “为 了 确定 因子 载荷 量 的 值 而 存在 的 分 析 方法 ”作为 因子 分 析 的 定义 。 也 
许 会 有 读者 感到 疑惑 “这 难道 不 是 验证 型 因子 分 析 ' 的 定义 吗 ? ”请 不 要 误会 ， 笔 者 
并 没有 将 因子 分 析 定义 为 “为 了 “精确 地 ”确定 因子 载荷 量 的 值 而 存在 的 分 析 方法 "。 


1 实际 上 ,因子 分 析 可 以 大 致 分 为 探索 型 因 于 分 析 和 验证 型 因 于 分 析 ( 确认 型 因 于 分 析 )。 通 常 我 们 将 前 者 称 为 “ 因 
子 分 析 ”， 本 书 所 讲 的 也 正 是 前 者 。 
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& 6. 因子 载荷 量 小 的 变量 的 处 理 方法 % 





在 做 因子 分 析 时 ， 会 有 像 下 图 这 样 意外 的 情况 发 生 ， 就 是 任何 一 个 公共 因子 都 不 
会 对 某 个 因 变 量 产生 太 大 影响 。 






































人 图 5.1 任何 一 个 公共 因子 都 不 会 对 某 个 因 变量 产生 太 大 影响 的 情况 
( 因子 载荷 量 的 绝对 值 在 0.5 以 上 的 ， 用 粗 箭头 标记 ) 


这 种 情况 下 ， 建 议 您 采用 以 下 任意 一 种 方法 进行 处 理 : 


* 将 这 个 因 变量 剔除 后 再 进行 因子 分 析 。 

+ 不 剔除 这 个 因 变 量 ， 而 是 将 “因子 载荷 量 的 绝对 值 为 0.5 以 上 ”这 个 划分 标准 ， 
按照 “0.5 以 上 一 0.45 以 上 一 04 以 上 一 ……” 这 样 的 趋势 逐步 下 降 ， 迫 使 “任何 一 
个 公共 因子 都 不 会 对 某 个 因 变量 产生 太 大 影响 ”的 情况 不 再 发 生 。 


后 者 中 “因子 载荷 量 的 绝对 值 为 XX 以 上 ”中 的 XX, 并 不 存在 统计 学 上 的 依据 ， 
不 过 通常 是 03 到 0.5 之 间 某 一 个 值 。 
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š 7. 极 大 似 然 法 & 





71 极 大 似 然 法 概要 
在 因子 载荷 量 的 计算 方法 中 ， 比 较 著名 的 除了 我 们 讲 过 的 主因 子 法 ， 还 有 极 大 似 
然 法 '。 下 面 通过 本 章 的 例子 来 讲解 一 下 这 种 计算 方法 。 


L= 因 变 量 的 个 数 + log (XX 的 行列 式 ) 一 六 的 主 对 角 线 上 的 值 的 和 ， 其 中 





m ra neffa as d o … of 
ya|™ m i nas anffan an ~ “le 0 ai 0 

: : > : Ñas an … de > : Pan 

eee) || Cd 0 0 … d 

1 0.65 … 0.14]fan as d 0 of 

= 055 1 +e 0.01la asas an + as AES 三 0 

i AES u w PS 3 E 3 N. 
0.14 001 1 工作 ce an 0 0 + 4 
a, a 





极 大 似 然 法 就 是 求解 令 工 值 最 大 的 | PIE 


Ga qe 


最 近 好 像 有 消息 称 “ 极 大 似 然 法 似乎 比 主因 子 法 好 "。 如 此 一 来 ， 笔 者 担心 会 让 
人 们 走 进 一 个 误区 ， 就 是 无 论 什么 情况 都 认为 使 用 极 大 似 然 法 为 佳 。 请 您 注意 ,使 用 
极 大 似 然 法 的 前 提 是 总 体 中 的 数据 要 服从 多 变量 正 态 分 布 。 


7.2 MARERA 
为 什么 会 说 极 大 似 然 法 比 主因 子 法 更 好 一 些 呢 ? 原因 之 一 就 是 它 能 够 进行 “ 拟 合 
优 度 检验 ”“。 所 谓 “ 执 合 优 度 检验 "， 大 体 上 讲 ， 就 是 进行 如 下 讨论 的 检验 。 


1. 顺便 提 一 下 ， 还 有 最 小 二 乘法 、 正 则 化 最 小 二 乘法 这 些 计算 方法 - 

2 本 书 对 行列 式 不 做 介绍 

3. 多 变量 正 态 分 布 的 概率 密度 函数 写 起 来 是 一 个 非常 繁杂 的 式 子 ， 同 时 式 中 还 需要 对 很 多 符号 做 出 解释 ， 为 了 各 
免 这 种 情况 ， 这 部 分 内 容 从 略 。 直 观 上 理解 顾名思义 ， 可 以 认为 是 正 态 分 布 的 多 变量 版 本 。 

4 认为 极 大 似 然 法 好 的 其 他 理由 ， 在 本 书 中 不 做 介绍 ， 但 是 可 以 求 出 “ 执 合 优 度 指 标 ”的 值 也 是 其 中 一 个 原因 。 
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原 假设 公共 因子 的 个 数 是 m 
备 择 假设 公共 因子 的 个 数 不 是 严 











在 “ 拟 合 优 度 检验 ”中 ， 如 果 p 值 比 有 意义 的 标准 小 ， 则 说 明 备 择 假设 成 立 ,也 
就 是 说 可 以 得 到 “公共 因子 的 个 数 不 是 m” 这 一 结论 。 但 如 果 p 值 大 ， 则 说 明 原 假设 
并 没有 错 ， 也 就 是 说 可 以 得 到 这 样 的 结论 :“ 公 共 因 子 的 个 数 可 能 是 m 也 可 能 不 是 m, 
再 进一步 扩大 解释 的 话 ， 就 是 可 以 当 作 m 左右 "。 

“ 拟 合 优 度 检验 ”的 优势 在 于 ， 可 以 大 概 地 掌握 公共 因子 的 个 数 。 但 是 尽管 如 此 ， 
并 不 表示 最 恰当 的 个 数 会 自动 地 显现 出 来 ， 具 有 如 此 强大 功能 的 检验 是 不 存在 的 。 








& 8. 旋转 与 Varimax 法 š> 





正如 第 174 页 所 讲 , 旋转 存在 着 很 多 种 方法 。 但 是 不 知 为 什么 , 不 管 是 论文 也 好 ， 
报告 也 好 ， 实 际 情况 却 是 一 一 只 有 Varimax 法 被 广泛 地 使 用 着 。 

为 何 只 是 Varimax 法 ? 笔者 没有 从 事 过 “因子 分 析 史 ”的 研究 ， 所 以 其 中 原委 便 
不 得 而 知 了 。 不 过 ， 数 年 前 曾 听 某 位 统计 学 者 这 样 说 过 :“ 做 旋转 的 时 候 ， 如 果 用 的 
不 是 Varimax 法 ， 周 围 的 人 会 责问 ， 但 如 果 是 Varimax 法 便 没有 人 会 说 什么 了 ， 仅 此 
TE.” 因此， 我 们 可 以 假设 发 生 了 如 下 的 演变 : 

四 很 久 以 前 ,研究 人 员 ( 非 统计 学 者 ) 发 表 了 关于 Varimax 法 的 研究 结果 。 

@ 获悉 这 些 研究 结果 的 其 它 研 究 人 员 觉 得 “因子 分 析 似乎 也 挺 有 意思 的 "， 他 们 
自己 也 发 表 关 于 Varimax 法 的 研究 结果 。 

@ 随 着 时 间 的 推移 ， 关 注 这 一 领域 的 研究 结果 、 以 及 追随 和 @ 的 研究 结果 变 
得 庞大 起 来 。 这 样 一 来 就 给 人 留 下 了 一 个 并 没有 什么 根据 的 印象 ， 认 为 “因子 分 析 的 
旋转 指 的 就 是 Varimax 法 ”。 : 

@@“ 仔 细 想 想 ， 无 论 做 什么 研究 都 要 用 Varimax 法 "， 存 在 这 种 想法 的 研究 人 员 
过 去 并 不 是 没有 ， 只 是 因为 不 想 引 来 麻烦 ， 所 以 即便 不 是 很 明白 其 中 的 原因 ， 也 会 顺 
应 潮流 地 称 “ 因 子 分 析 的 旋转 指 的 就 是 Varimax 法 ”。 
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@ 随 着 D 和 @ 的 发 展 ， 研 究 结果 变 得 日 益 丰 富 ， 逐 渐 形成 了 现在 的 局 面 。 

请 您 注意 ， 笔 者 并 不 是 认为 Varimax 法 “不 妇 ”“ 不 能 用 ”"， 只 是 将 “为 何 一 提起 
旋转 就 会 想到 Varimax 法 ”作为 一 个 话题 进行 讨论 。 

笔者 估计 如 果 我 们 对 之 后 要 讲 的 Promax 法 也 稍 做 研究 的 话 ， 可 能 就 会 同 
Varimax 法 一 样 ， 以 相同 的 模式 发 展 吧 。 





& 9. 因子 载荷 量 矩 阵 和 因子 结构 和 矩阵 & 





本 节 的 内 容 有 些 抽象 ， 因 此 本 想 说 “不 擅长 数学 的 读者 可 以 跳 过 本 节 不 做 阅读 ”， 
但 是 如 果 不 理解 本 节 内 容 的 话 便 无 法 理解 下 一 节 的 内 容 ， 所 以 请 您 尽量 克服 困难 。 


Qo An … as 
正如 第 172 页 所 讲 ,我 们 将 |“ “| 称 为 因子 载荷 量 失 隆 或 因子 模式 类 隆 。 
Am Ap + dpm 


从 第 2 公共 因子 /指向 因 变量 p 的 因子 载荷 量 。 


m mh na 
W Y U TWOB Ts, 
To T o Ty. 


! 


第 2 公共 因子 矿 同 因 变量 六 的 单 相关 系数 。 


在 正 交 因子 模型 的 情况 下， 因子 载 荷 量 矩 阵 和 因子 结构 矩阵 相 一 致 。 也 就 是 说 有 
这 样 的 关系 成 立 : 


=m 


Asi 
£ 4 
第 1 公共 因子 所 指向 因 变量 6 的 因子 载荷 量 第 1 ASE f. f RE 6 的 单 相关 系数 
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如 果 是 斜 交 因子 模型 ， 则 这 个 关系 不 成 立 。 
值得 注意 的 是 ， 在 下 表 中 记录 的 是 第 152 页 的 数据 和 第 188 页 的 因子 得 分 的 一 
部 分 。 


多 表 5.1 第 152 页 的 数据 和 第 188 页 的 因子 得 分 的 一 部 分 








Sst 

Qla 第 1 公共 因子 
| ”店面 的 设计 f 

A 5 138 

B $ 1.27 

c 4 0.28 

D 2 0.34 

E 3 -045 

F 5 1.20 

G 5 1.22 

H 3 -1.60 

1 4 -0.68 

J 1 -1.61 

K 3 -0.62 

L 4 0.24 

M 3 -0.64 

N 4 0.24 

o 2 -0.56 








求 得 它们 的 单 相关 系数 的 值 为 079， 这 与 第 179 页 因子 载荷 量 矩 阵 中 的 b=0.78 
并 不 一 致 。 这 是 因为 上 表 中 的 因子 得 分 不 是 “准确 值 ”， 而 是 “估计 值 ”。 


1. 如 第 186 页 所 讲 ， 因 子 得 分 的 计算 方法 有 “回归 法 "、*Bartlett 法 ”和 “Anderson-Rubin 法 "， 等 等 。 计 算 方法 如 
此 多 种 多 样 也 就 意味 着 ， 并 不 存在 一 种 独一无二 的 方法 可 以 求 出 因子 得 分 的 “准确 值 "。 


201 





& 10. Promax 法 & 





10.1 Promax 法 的 概要 


正如 之 前 所 讲 的 那样 , 斜 交 旋转 中 最 著名 的 方法 当 属 Promax 法 。 所 谓 Promax 法 ， 
笼统 地 讲 ， 就 是 遵循 以 下 步 又 进行 的 方法 。 


(D 按照 Varimax 法 进行 旋转 。 

@ 假定 一 个 “ 真 的 因子 载荷 量 矩 阵 "， 也 就 是 说 “就 现 有 的 经 验 来 讲 ， 总 体 的 形 
式 应 该 是 这 样 "。 我 们 将 这 个 和 矩阵 称 为 “目标 矩阵 "。 

图 旋转 D 中 的 轴 ， 使 其 尽 可 能 地 靠近 @ 中 所 假定 的 目标 矩阵 。 


但 是 ， 让 我 们 感到 困惑 的 是 我 们 并 不 知道 总 体 的 情况 ， 这 样 也 就 无 法 找 出 之 
前 第 @ 步 中 所 假定 的 目标 矩阵 。 接 下 来 ， 让 我 们 就 本 章 的 例子 ， 来 讲 一 讲 如 何 使 用 
Promax 法 进行 旋转 。 


ci es] |0.98599 0.00005 
cx ¢n| |0.99538 
cx ca| _ [0.99966 











C= Iu. cx} 7 [0.00000 
ca ca| [0.00001 
ca cal |0.00003 
bi + bh ba _ F''_ v0.89? + 0.04? 0.04 + 
V ° x = 0.00001 
ba «| eae [ 0.04 EAI 


按照 上 述 计算 所 求 得 的 矩阵 C， 我 们 就 将 其 看 成 是 目标 矩阵 。 并 且 运算 过 程 中 所 
出 现 的 b, 和 b,, 等 参数 ， 就 是 通过 Varimax 法 旋转 后 得 到 的 因子 载荷 量 矩 阵 刀 的 值 。 
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bu ba) [078 0.07 
bx bs| [0.89 0.04 
_|b bal |099 0.01 
ba bal [0.01 0.94 
bs ba| [0.05 0.86 
bu ba] (0.06 0.79 


x 是 要 由 分 析 者 自己 规定 的 值 ， 这 里 我 们 虽然 给 出 的 是 4， 但 通常 情况 下 使 用 2、 
3 或 4 都 是 可 以 的 。 

可 能 有 些 读者 还 是 感觉 有 些 模糊 ， 不 是 非常 理解 。 也 就 是 说 ， 可 能 存在 着 如 下 疑 
惑 : 


' 赁 什么 就 能 断言 “目标 和 矩阵 = 矩阵 C”? 

“的 值 由 分 析 者 自己 主观 地 进行 规定 ， 这 样 听 起 来 不 是 很 芒 廖 吗 ? 

+ Promax 法 原本 应 该 是 余 交 旋转 ， 但 是 为 何 最 初 要 用 Varimax 法 这 种 正 交 旋转 法 
即便 您 可 以 理解 这 种 方法 ， 也 要 注意 。 请 您 转换 思路 想 一 想 ， 令 “目标 和 矩阵 = 


和 矩阵 C” 就 是 Promax 法 的 一 部 分 ; 对 k 值 的 主观 规定 也 是 Promax 法 的 一 部 分 ; 最 
初 要 用 Varimax 法 进行 旋转 还 是 Promax 法 的 一 部 分 。 
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10.2 ”因子 载荷 量 矩 阵 、 因 子 相关 和 矩阵 以 及 因子 结构 矩阵 


就 本 章 的 例子 来 讲 ， 通 过 Promax 法 进行 旋转 之 后 的 因子 载荷 量 和 矩阵、 因子 相关 
和 矩阵 以 及 因子 结构 矩阵 ， 可 以 通过 以 下 计算 求 得 。 所 谓 因子 相关 和 矩阵， 就 是 记录 着 公 


共 因 子 相互 间 的 单 相关 系数 的 矩阵 。 
在 以 下 讲解 中 出 现 了 过 多 的 矩阵 ， 所 以 ， 为 了 便于 讲解 ， 我 们 将 矩阵 命名 为 “P" 
和 “CO"。 
B 因子 载荷 量 和 矩阵 P 
078 003 
089 001 
pe hae ni 111 s Ë: “| 099 -0.03 
Pile 0.05 | 0.88| |-0.03 0.94 
eee 0 0.02 0.86 


scan oa 002 0.79 








o- lo ~ oe 0.07 jem = wj” epa | ‘fi -us 
007 … 0.79 n a Do i os 这 | —— 0.98987| 上 005 E 
a 111 -0.05] 1.11 -0.05]}'fo.81 0.07 
“ll-00s 1.15-0.05 1.15f) [0.07 0.77 
D-[V081 a -> s] 
|o v7 | PA 
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m 因子 相关 和 矩阵 上 


Pa: 0.9991 0.0414][0.9991 0.0421 
0.0414 0.9991 


<a 0.9991 


图 因子 结构 矩阵 S 


078 003 
0.89 00 


S= 0.03 oo94loos 1 
002 086 


0.02 079 


0.99 znl 1 a 


0.78 
0.89 
0.99 


~ 10.05 


0.09 
0.09 


pie oa- bos ° 


1.11 -0.05090 0 |['_ [0.9991 0.0414 
-0.05 1.15], 0 oos] ~ 


0.0421 


0.10 
0.08 
0.05 
0.94 
0.86 
0.79 
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10.3 分 析 结果 的 精度 


经 过 Promax 法 旋转 后 所 得 到 的 分 析 结 果 ， 其 精度 并 不 是 通过 贡献 率 或 累积 贡献 
率 来 评价 的 ， 而 是 用 被 称 作 “ 排 除 其 他 公共 因子 影响 后 的 贡献 ”或 “忽略 其 他 公共 因 
子 后 的 贡献 ”的 指标 进行 评价 的 ， 此 外 便 没有 什么 评价 指标 了 。 

“排除 其 他 公共 因子 影响 后 的 贡献 ”的 概念 理解 起 来 比较 困难 ， 所 以 这 里 我 们 只 
介绍 “忽略 其 他 公共 因子 后 的 贡献 ”'。 

“忽略 其 他 公共 因子 后 第 ;公共 因子 的 贡献 "， 就 是 将 因子 结构 矩阵 中 第 ;公共 因 
子 所 对 应 的 各 单 相关 系数 的 值 取 平 方 再 按 列 相 加 后 便 可 得 到 。 就 本 章 的 例子 来 讲 ， 如 
下 所 示 。 





=] 忽略 其 他 因子 后 的 贡献 





rit rit rit rat rat ra 
第 1 公共 因子 | = 0.78" + 0.89: + 0.99: + 0.05° + 0.09: + 0.09 
=2.40 





Nit rit rit rit rh tri, 
第 2 公共 因子 | = 0.10 + 0.08" + 0.05" + 0.94" + 0.867 + 0.797 


=228 








这 个 值 越 大 就 意味 着 其 所 对 应 的 公共 因子 与 多 个 因 变量 的 关联 性 越 强 。 但 是 它 并 
不 能 像 Varimax 法 那样 ， 求 出 “忽略 其 他 公共 因子 后 的 贡献 “ 率 '”。 

“忽略 其 他 公共 因子 后 的 贡献 ”不 是 绝对 的 ， 而 是 相对 的 。 也 就 是 说 ， 它 仅仅 是 
一 个 只 能 说 出 “这 个 公共 因子 比 那 个 公共 因子 大 ， 还 是 那个 公共 因子 比 这 个 公共 因子 
大 ”的 、 十 分 宽泛 的 评价 指标 。 因 此 ， 不 可 否认 的 是 ,尽管 您 花费 了 一 番 功夫 将 它 求 
出 来 ， 可 最 终 还 是 不 能 完全 理解 它 的 意义 


L 说 到 底 ， 是 因为 概念 不 易 理解 才 不 做 介绍 的 ， 但 这 并 不 意味 着 “排除 其 他 公共 因子 影响 后 的 贡献 ”不 可 用 。 
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104 ”因子 得 分 
就 本 章 的 例子 来 讲 ， 经 过 Promax 法 旋转 后 ， 基 于 回归 法 的 因子 得 分 可 以 按照 以 
下 计算 过 程 求 得 。 





fa fo 12 16 13 04 05 -0.9| 
fa fe 12 0.8 13 -1.2 -1.0 -0.9 
hk 04 08 03 04 05 0.6 
fafaj |-12 01 0.3 -0.4 -0.3 -0.1 
fa fa| |-04 0.1 -0.6 -0.4 0.5 -1.6][ 1 0.65 0.80 0.11 0.01 0.14} [0.78 0.10 
fife 12 0.8 1.3 -0.4 -1.0 -0.1||0.65 1 0.89 0.02 0.19 0.01| [0.89 0.08 
f fa 12 16 13 04 13 13||080 089 1 0.02 0.04 0.10| [0.99 0.05 
fa fa|=|-04 -1.5 -1.6 1.3 0.5 0.6||0.11 0.02 0.02 1 0.82 0.77) [0.05 0.94 
Sh fa 0.4 -1.5 -0.6 -0.4 -1.0 -0.1]]0.01 0.19 0.04 0.82 1 0.64} 10.09 0.86 
hh fa| |-2.0 -0.7 -1.6 -1.2 -1.0 -0.9|10.14 0.01 0.10 0.77 0.64 1 | [0.09 0.79 
Sa f| |-0.4 -0.7 -0.6 -2.1 -1.8 -1.6 
fa fa 04 01 03 04 -0.3 0.6) 
fa faj |-04 -0.7 -0.6 04 13 13 
fa fa 04 01 03 13 05 13 
fi fal |-12 -0.7 -0.6 13 13 06 
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R11. 能 够 假定 的 公共 因子 个 数 的 上 限 > 





至 少 我 们 讲 过 的 使 用 Varimax 法 或 Promax 法 旋转 进而 完成 的 因子 分 析 中 ， 所 能 
够 假定 的 公共 因子 的 个 数 是 存在 上 线 的 。 具 体 地 讲 就 是 ， 公 共 因 子 的 个 数 一 定 要 满足 
以 下 关系 ， 请 您 记 住 这 一 点 。 


2 x 因 变 量 的 个 数 + 1 — ,8x 因 变量 的 个 数 +1 
2 





公共 因子 的 个 数 < 


根据 以 上 不 等 式 计算 能 够 假定 的 公共 因子 个 数 的 上 限 ， 计 算 结 果 见 下 表 ， 请 您 
参考 。 


*#52 能 够 假定 的 公共 因子 个 数 的 上 限 








[Tm [TT 
MERN 公共 因子 个 MERN DREFN 
数 的 上 限 数 的 上 限 
1 > 0 21 一 15 
2 > 0 22 > 15 
3 一 23 一 16 
4 一 1 24 一 17 
3 = 2 25 = 18 
6 = 3 26 一 19 
7 > 3 27 * 20 
8 > 4 28 > 21 
9 > s 29 S 21 
10 > 6 30 * 22 
ll 6 31 as 23 
12 = 7 32 ° 24 
13 = 8 33 * 25 
14 sa 9 34 * 26 
15 10 35 = 27 
16 > 10 36 > 28 
17 > 11 37 一 28 
18 > 12 38 > 29 
19 > 13 39 = 30 
20 * 14 40 $ 31 
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& 12. 主因 子 法 和 Varimax 法 真 的 过 时 了 吗 ç 





可 能 本 节 的 内 容 不 太 容易 理解 ， 但 是 如 果 是 初次 接触 因子 分 析 的 读者 ， 还 请 您 一 
定 要 阅读 本 节 内 容 。 

在 本 章 的 例子 中 ， 因 子 载荷 量 的 计算 方法 采用 的 是 主因 子 法 ， 旋 转 方法 采用 的 
是 Varimax 法 。 实 际 上 ， 主 因子 法 也 好 ，Varimax 法 也 好 ， 都 可 以 说 是 “过 时 的 方法 ” 
T, 都 已 经 渐渐 地 被 人 们 当 作 “ 不 适合 的 方法 ”了 。 具 体 地 讲 就 是 ， 如 今 “ 主 因子 法 
+Varimax 法 ”已 经 渐渐 地 被 “ 极 大 似 然 法 +Promax 法 ”所 取代 。 

将 主因 子 法 和 Varimax 法 看 成 是 “过 时 的 方法 "， 笔 者 对 这 种 作法 持 怀疑 态度 。 
理由 如 下 所 述 。 


` 主因 子 法 从 整体 上 来 讲 ,就 是 所 谓 的 谱 分 解 '， 这 种 计算 方法 并 无 “新 旧 ”、“ 好 
坏 ” 之 论 。 

， 同 极 大 似 然 法 相 比 ， 主 因子 法 没有 像 “ 总 体 必 须要 服从 多 变量 正 态 分 布 ”这 样 
较 强 的 约束 条 件 。 

+ 主因 子 法 看 上 去 比较 复杂 ， 但 实际 上 计算 起 来 比 极 大 似 然 法 容易 ?。 

,再 看 一 看 用 来 代替 Varimax 法 的 Promax 法 ， 其 目标 矩阵 、« 值 的 取 值 方法 都 存 
在 着 莫名 其 妙 之 处 ， 所 以 也 不 能 无 条 件 地 称颂 这 种 旋转 方法 。 

,虽然 在 Varimax 法 中 ， 我 们 假定 “任意 两 公共 因子 间 的 单 相关 系数 的 值 为 0” 
的 作法 也 不 是 很 合理 , 但 是 , 若 只 是 因为 “计算 比较 容易 "“ 电 脑 的 性 能 达 不 到 要 求 " 
等 这 些 并 不 影响 我 们 探求 真理 的 理由 ， 就 突然 将 长 久 以 来 所 默认 的 Varimax 法 看 作 是 
“过 时 的 方法 "、“ 不 适合 的 方法 "， 这 样 做 是 不 是 太 不 合理 了 。 

+ 如果 将 主因 子 法 和 Varimax 法 当 作 “ 过 时 的 方法 ”"、“ 不 适当 的 方法 ”"， 就 等 于 
是 在 说 “根据 主因 子 法 和 Varimax 法 得 来 的 研究 结果 不 值得 一 看 ， 也 没有 参考 价值 ， 
可 以 忽略 不 计 "。 然 而 现 有 * 的 研究 结果 几乎 都 是 由 “主因 子 法 + Varimax 法 ”得 来 的 ， 
要 是 按照 刚才 的 意思 ， 岂 不 是 在 说 我 们 找 不 到 能 够 依据 的 资料 了 *。 


1. 粗略 地 讲 ， 第 76~78 页 所 讲 的 就 是 谱 分 解 。 

2 笔者 主观 认为 。 

3. 这 一 部 分 写 于 2006 年 秋 。 

4 如 果 对 周围 的 人 不 假 思索 地 说 “你 怎么 还 用 主因 子 法 .Varimax 法 来 做 因子 分 子 啊 ? 真 拿 你 没 办 法 啊 ” 之 类 的 话 ， 
笔者 认为 ， 结 果 反 而 会 令 说 这 些 话 的 人 感到 难堪 
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笔者 认为 ， 对 于 因子 载荷 量 的 计算 方法 来 说 ， 主 因子 法 和 极 大 似 然 法 的 区 别 并 
不 在 于 “新 与 日 、“ 好 与 坏 "， 而 应 当 是 “流派 ”的 不 同 。 就 旋转 方法 来 说 ， 虽 然 
Varimax 法 中 “任意 两 公共 因子 间 的 单 相关 系数 的 值 为 0” 的 假设 确实 有 些 不 合理 
但 是 尽管 如 此 ，Promax 法 中 也 有 难以 消除 的 、 莫 名 其 妙 之 处 。 因 此 ， 笔 者 总 觉得 同 
Promax 法 相 比 ，Varimax 法 还 是 有 可 取 之 处 的 。 





8 13. 因子 分 析 中 的 术语 & 





本 书 始终 将 因子 分 析 中 的 因 变量 称 为 “ 因 变 量 "， 但 是 还 请 读者 注意 ， 通 常情 况 
下 我 们 也 将 其 称 为 观测 变量 。 
还 有 ， 有 时 也 将 公共 因子 称 为 潜 变 量 ， 将 因子 载荷 量 称 为 路 径 系数 。 
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对 了 1 gum 


Vš 












做 了 那么 多 事 就 是 不 
想 让 你 再 打捞 露 儿 ! É 



































WW 


是 爸爸 您 在 我 上 高 中 
时 ， 为 了 让 我 学 习 统 


计 学 所 以 才 请 来 了 山 
本 老师 ! 














SSS S 
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E 
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M 
答 答 您 不 讲 道理 ! 


A 

















— 实际 上 ， 山 本 的 这 些 
FHRA, & b 
不 太 会 说 话 ， 但 NS 
@ ñ 
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好 吧 ， 各 位 ! 
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附录 
各 种 各 样 的 分 析 方法 


1, 多 变量 分 析 
1.1 多 变量 分 析 的 概要 
12 重 回归 分 析 
13 Logistic 回归 分 析 
14 聚 类 分 析 
1.5 对 应 分 析 以 及 数量 化 正 类 
1.6 结构 方程 模型 
2. 其 他 
2.1 统计 的 假设 检验 
22 Kaplan-Meier 法 


分 析 方法 。 

“* 存 在 着 什么 样 的 分 析 方法 

“名 种 分 析 方法 的 具体 内 容 

“各 种 分 析 方法 可 以 用 来 做 什么 

请 您 按 以 上 思路 进行 阅读 。 

此 外 ， 本 蔬 己 《漫画 统计 学 》 和 《 淄 画 统计 学 之 回归 分 析 》 不 同 ， 难 以 用 Excel 进行 计算 ， 所 以 
本 书 中 对 使 用 Excel 计算 的 步骤 不 做 介绍 。 














& 1. 多 变量 分 析 & 





11 多 变量 分 析 的 概要 


如 第 11 页 所 述 ， 多 变量 分 析 是 对 由 多 个 变量 组 成 的 数据 进行 分 析 的 分 析 方法 的 
统称 ， 如 下 表 所 示 。 











变量 1 变量 2 * 变量 p 


受 访 者 1 
受 访 者 2 











受 访 者 n 


属于 “多 变量 分 析 ” 这 一 范畴 内 的 分 析 方法 ， 除 了 本 书 所 讲 的 主 成 分 分 析 和 因子 
分 析 以 外 ， 还 有 很 多 种 类 。 下 图 中 列 出 几 种 代表 性 的 方法 。 






变量 是 否 可 测 ? 
可 测 


不 可 测 a 不 可 测 





istic E 主 成 分 分 析 因子 分 析 
| 重 回归 分 析 | Logistic 回归 分 析 J! 桶 类 分 析 | 数量 化 下 类 | 





本 节 将 针对 上 图 中 的 内 容 进行 如 下 介绍 。 


* 重 回归 分 析 

* Logistic 回归 分 析 
* 聚 类 分 析 

* 数量 化 下 类 


同时 也 会 介绍 对 应 分 析 以 及 结构 方程 模型 。 
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12 重 回归 分 析 
重 回归 分 析 是 基于 多 个 自 变量 来 预测 数值 的 一 种 分 析 方 法 。 


图 具体 实例 
下 表 中 记录 的 是 来 自 “ 风 见面 包 房 ”( 一 家 面包 连锁 店 ) 的 数据 。 









































店铺 面积 距 最 近 车 站 的 距离 月 营业 额 
(m) (m) (万 日 元 ) 
梦 之 丘 总 店 10 80 469 
寺 井 站 大 楼 店 8 0 366 
曾 根 店 8 200 371 
桥 本 大 街 店 5 200 208 
桔梗 叮 店 7 300 246 
邮电 局 前 店 8 230 297 
水 道 町 站 前 店 7 40 363 
六 条 站 大 楼 店 $ 0 436 
若 叶 川 沿线 店 6 330 198 
美里 店 9 180 364 
假定 各 变量 间 存在 如 下 关系 : 
店铺 面积 | 中 最 近 车 站 的 距离 | 
月 营业 额 











然后 进行 重 回归 分 析 ， 可 推导 出 下 式 : 
y= 41.5x,- 03x, + 65.3 


Py ake t 
Ess Cus wes a 





Boooee 


对 重 回归 分 析 感 兴趣 的 读者 ， 可 以 参见 本 系列 图 书 中 的 《漫画 统计 学 之 回归 分 析 》 该 
书 中 对 此 处 所 举 的 具体 实例 的 重 回归 分 析 作出 了 详细 介绍 。 
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1.33 _ Logistic 回归 分 析 
Logistic 回归 分 析 是 基于 多 个 自 变量 来 预测 概率 的 一 种 分 析 方法 。 
g 具体 实例 


下 表 记 录 的 是 一 种 称 为 “ 诺 伦 特 供 ”蛋糕 的 销售 情况 ， 这 种 蛋糕 在 露 儿 打 工 的 茶 
餐厅 -一 诺 伦 茶 餐厅 ， 每 日 限 售 1 个 。 








周三 、 周 六 或 周 日 sra Wene 
5 日 (一 ) 0 38 " 
6 日 (二 ) 0 24 N 
7 日 (三 ) 1 2% ; 
8 日 (四 ) 0 2 å 
9 日 (五 ) 0 23 
10 日 (六 ) 1 28 i 
WA CH) 1 24 ; 
12 日 (一 ) o * i 
B H (2) 0 25 a 
14 日 (三 ) 1 28 N 
15 日 (四 ) 0 21 š 
16 日 (五 ) 0 2 a 
178 (A) 1 >” i 
18H (H) 1 26 i 
19 日 (一 ) 0 26 Š 
20 日 (二 ) 0 x ò 
21 日 (三 ) 1 a I 
22 日 (四 ) 0 x” i 
23 日 (五 ) 0 23 6 
24 日 (六 ) 1 2 > 
25 日 (日 ) 1 x î 
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假定 各 变量 间 存在 如 下 关系 : 





周三 、 周 六 或 周 日 最 高 气温 























诺 伦 特 供 蛋 糕 的 
销售 情况 








然后 进行 Logistic 回归 分 析 ， 可 以 推导 出 下 列 : 


Y= T + e ro 


t 
诺 伦 特色 的 销售 周三 、 周 最 高 气温 
情况 ANH 


代入 不 同 的 x 与 x, 的 值 ， 就 能 够 估算 出 值 。 


@oooeoe 


对 Logistic 回归 分 析 感 兴趣 的 读者 ,可 以 参见 本 系列 图 书 中 的 《漫画 统计 学 之 回归 分 析 》 
该 书 中 对 此 处 所 举 的 具体 实例 的 Logistic 回归 分 析 作 出 了 详细 介绍 。 
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14 聚 类 分 析 


聚 类 分 析 ( Cluster Analysis )， 就 是 基于 分 析 对 象 间 的 距离 将 分 析 对 象 分 为 若干 
类 的 一 种 分 析 方法 。 所 谓 “ 分 析 对 象 ” 指 的 就 是 个 体 或 者 变量 。 

也 许 有 读者 会 这 样 认为 “不 用 刻意 去 做 所 谓 的 聚 类 分 析 ， 只 做 主 成 分 分 析 或 者 因 
子 分 析 不 是 也 能 够 将 个 体 和 变量 进行 分 类 吗 "。 这 种 想法 确实 没 错 ， 但 是 主 成 分 分 析 
或 因子 分 析 只 能 进行 粗略 的 分 类 ， 也 就 是 说 仅仅 只 是 “看 着 散 点 图 ， 指 出 某 个 受 访 者 
和 某 个 受 访 者 好 像 比较 类 似 ” 这 种 程度 上 的 分 类 。 若 想 进行 更 为 严格 的 分 类 ， 就 要 使 


用 聚 类 分 析 进 行 分 类 了 。 
图 具体 实例 


下 表 记 录 的 是 某 个 补习 班 上 中 学 三 年 级 学 生 的 测验 结果 。 
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语文 社会 理科 英语 数学 
A 9 100 89 84 77 
B 100 98 89 95 86 
c 84 84 99 85 100 
D 70 B 92 66 77 
E 70 72 89 66 75 
F 66 68 95 57 82 
G 74 70 % 9 88 
H 74 15 95 70 79 
1 16 77 92 78 83 
1 79 88 100 86 100 





假定 将 其 分 为 2 类， 进行 聚 类 分 析 ， 可 以 得 到 以 下 结果 。 











(Əeoooo 


在 阅读 具体 实例 的 过 程 中 ， 也 许 会 有 不 少 读者 感到 疑惑 。 实 际 上 ， 在 聚 类 分 析 中 分 类 的 
个 数 是 分 析 者 在 分 析 之 前 就 已 经 “判断 ”出 来 的 。 这 同 因子 分 析 中 公共 因子 的 个 数 是 分 析 者 
在 分 析 之 前 就 已 经 “假定 ”出 来 的 情况 是 一 样 的 。 

聚 类 分 析 ， 是 基于 分 析 对 象 间 的 距离 来 对 分 析 对 象 进行 分 类 的 ， 说 到 底 是 一 种 数学 分 析 
方法 。“ 第 1 类 是 由 具有 怎样 特征 的 人 所 构成 的 集合 "， 这 是 在 进行 聚 类 分 析 之 前 所 不 由 知道 
的 。 各 类 的 特征 只 有 在 进行 聚 类 分 析 之 后 ， 才 能 由 分 析 者 “事后 诸葛 ” 般 地 、“ 主 观 地 ”做 
出 推断 ， 比 如 “第 1 类 是 学 习 好 的 人 ， 那 第 2 类 就 是 学 习 不 好 的 人 吧 ”。 

聚 类 分 析 存在 着 很 多 “流派 "， 也 就 是 很 多 种 计算 方法 。 

请 您 再 仔细 阅读 一 下 本 栏 所 写 的 内 容 。 您 就 会 发 现 ， 聚 类 分 析 一 一 这 种 分 析 方法 中 的 许 
多 环节 ， 不 免 要 被 指责 为 “主观 腾 断 "。 这 些 内 容 在 普通 的 书籍 中 不 会 被 提 到 ， 所 以 先 在 这 
里 提示 一 下 。 
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15 ”对 应 分 析 以 及 数量 化 川 类 

对 应 分 析 ( Correspondence Analysis ) 是 一 种 同 数量 化 由 类 非常 类 似 的 分 析 方法 。 
由 于 对 应 分 析 相对 容易 理解 ， 所 以 这 里 先 来 介绍 这 种 分 析 方法 ， 之 后 再 来 介绍 本 节 的 
正题 一 数量 化 看 类 。 此 外 ， 对 应 分 析 并 不 属于 一 般 的 多 变量 分 析 的 范畴 之 内 。 

对 应 分 析 是 一 种 将 列 联 表 ( 又 称 交叉 分 类 表 ，Cross-tabulation Table ) 画 成 散 点 
图 的 分 析 方法 。 更 确切 地 说 ， 就 是 将 “ 列 联 表 的 行 和 列 ”中 “能 够 充分 表达 列 联 表 信 
息 的 值 ”呈现 出 来 的 一 种 分 析 方法 。 也 可 以 理解 为 像 是 在 为 列 联 表 拍 摄 航空 摄影 一 样 




















的 分 析 方法 。 
国 具 体 实例 
下 表 是 以 初中 生 、 高 中 生 和 大 学 生 为 对 象 进行 的 某 个 问卷 调查 的 结果 ， 并 整理 成 
列 联 表 的 形式 。 
(单位 : 人 ) 
最 喜爱 的 艺术 家 ae 
A B 3 D 
初中 生 10 19 12 5 47 
学 生 类 型 | 高 中 生 13 8 15 16 52 
大 学 生 18 1 14 8 5 
合计 41 38 42 29 150 





对 上 表 进 行 对 应 分 析 ， 可 以 得 出 如 下 图 所 示 的 结果 。 





| 成 分 2 0.6 


04 





-06 -04 -02 














一 眼 就 能 看 出 这 样 的 结论 : “初中 生 喜 欢 B”",“ 高 中 生 喜 欢 D”,“ 大 学 生 喜 欢 A”。 
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接 下 来 进入 本 节 的 正题 。 数 量化 亚 类 ， 可 以 说 是 “一 种 以 原始 数据 为 对 象 的 对 应 
分 析 "。 


* 将 原始 数据 画 成 散 点 图 的 分 析 方法 

* 将 “作为 原始 数据 的 受 访 者 和 变量 ”中 “能 够 充分 表达 原始 数据 的 信息 的 值 ” 
呈现 出 来 的 分 析 方法 

+ 像 是 在 为 原始 数据 拍摄 航空 摄影 一 样 的 分 析 方法 











对 应 分 析 的 对 象 …… 数量 化 四 类 的 对 象 …… 
列 联 表 原始 数据 
甲 乙 AT 变量 1 | 变量 2 | 变量 3 | 变量 4 


























= — =e n m. o> 
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图 具体 实例 
下 表 记 录 的 是 对 20 多 岁 女 性 所 喜爱 的 杂志 的 调查 结果 。 





















































KK nana mommo Lay KITINA 
A 0 0 1 1 1 
B 0 0 0 1 0 
É 1 0 0 0 0 
D 1 0 0 0 š 
E 0 1 1 1 0 
F 0 1 0 1 0 
G 0 1 0 0 0 
H 1 1 1 0 1 
I 1 1 0 1 1 
J 1 0 0 1 1 
对 上 表 进 行 数量 化 亚 类 分 析 ， 可 以 得 出 如 下 图 所 示 的 结果 。 
成 分 2 成 分 2 
15 2 
10 
i -B 
05 * +A 
+ mommo x$ 
* E 
00 ° eo 二 
*KK * : j 
-05 < n 
nana k t 
-10 
“6 
-15 2 
-65 -0 -05 00 os 10 15 ° ' 2 
成 分 1 成 分 1 

















一 眼 就 能 看 出 这 样 的 结论 : “喜欢 nana 的 是 G",“ 喜 欢 KK 的 是 C”。 





Boooeoe 


对 数量 化 看 类 和 对 应 分 析 感 兴趣 的 读者 ， 可 以 参见 对 应 分 析 的 相关 书籍 。 
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16 ”结构 方程 模型 
我 们 将 以 下 这 种 图 称 为 路 径 图 。 



















































































路 径 图 ， 是 一 种 用 来 表示 分 析 者 的 “主观 ”假设 的 图 ， 分 析 者 认为 “实际 操作 中 
一 定 存在 着 图 中 所 示 的 结构 "。 和 矩形 表示 的 变量 是 可 观测 变量 ， 椭 圆 形 表示 的 变量 是 
潜 变量 。 

结构 方程 模型 ， 这 种 分 析 方法 是 用 来 验证 分 析 者 所 画 的 路 径 图 是 否 和 真实 情况 相 
一 致 ， 也 就 是 用 来 验证 分 析 者 所 做 的 主观 假设 一 一 “实际 操作 中 一 定 存在 着 图 中 所 示 
的 结构 ”是 否 和 真实 情况 相 一 致 。 也 是 为 了 求 出 路 径 系数 ( 相当 于 因子 载荷 量 、 即 各 
箭头 的 具体 值 ) 而 存在 的 分 析 方 法 。 

“结构 方程 模型 "， 这 个 名 称 是 由 Structural Equation Modeling 翻译 得 来 。 由 于 这 
个 名 字 过 长 ， 所 以 通常 将 其 简称 为 “SEM”。 

通常 ， 结 构 方程 模型 更 多 地 被 称 为 协 方差 结构 分 析 。 


g 具体 实例 
A. 
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Goooee 


结构 方程 模型 ， 相 当 于 第 40 页 所 讲 过 的 “验证 型 ”分 析 方法 。 也 就 是 说 ， 是 一 种 应 当 
按照 如 下 顺序 进行 的 分 析 方法 。 

人 建立 假设 

@ 收集 数据 

图 进行 分 析 

但 是 ,我们 还 是 不 能 充分 理解 这 些 步 又， 因为 在 具体 操作 时 ， 我 们 可 能 会 陷 人 以 下 这 些 
自 相 矛 盾 的 处 境 。 

“不 知道 存在 着 几 个 潜 变 量 

“不 知道 各 潜 变 量 和 各 观测 变量 之 间 存 在 着 怎样 的 关系 

"不 知道 箭头 应 当 指 向 哪里 

“在 第 步 中 ， 即 便 不 知道 ， 也 要 通过 自己 的 思考 将 它们 确定 ， 这 已 经 成 为 使 用 结构 方 
程 模型 的 分 析 者 的 工作 "， 只 有 充分 地 认识 到 这 一 点 之 后 才能 进行 分 析 。 

实际 操作 中 ， 有 一 些 很 好 的 结构 方程 模型 软件 。 这 固然 是 值得 高 兴 的 。 但 是 软件 太 好 用 
了 也 会 带 来 弊端 , 比如 说 会 导致 “结构 方程 模型 很 简单 ”一 一 这 样 的 误解 蔓延 开 来 。 实 际 上 ， 
结构 方程 模型 并 不 简单 。 并 且 对 于 结构 方程 模型 来 说 ， 如 果 不 能 求解 的 话 ， 基 本 上 就 意味 着 
这 个 分 析 是 失败 的 。 因 此 ， 特 别 是 对 于 那些 从 业 人 员 ， 还 是 不 要 轻易 地 在 周围 的 人 (尤其 是 
客人 ) 面前 提出 “我 想 在 这 次 的 分 析 中 挑战 一 下 SEM” 为 好 。 
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@2 R g 





21 统计 的 假设 检验 

统计 的 假设 检验 ， 是 分 析 者 通过 样本 数据 ， 来 推测 其 建立 的 关于 总 体 的 假设 是 否 
正确 的 一 种 分 析 方法 ， 通 常 简称 为 “检验 ”。 

正如 刚才 所 讲 ， 统 计 的 假设 检验 ， 是 分 析 者 通过 样本 数据 ， 来 推测 其 建立 的 关于 
总 体 的 假设 是 否 成 立 的 一 种 分 析 方 法 。 但 是 绝对 不 能 认为 “只 要 “p 值 ”小 ， 就 意味 
着 “有 意义 '， 数学 上 就 能 讲 得 通 ”"、 这 样 做 “容易 得 到 数学 权威 人 士 的 认可 ”"。 由 于 
存在 这 种 误解 的 人 有 很 多 ， 所 以 从 现在 起 ， 不 单 是 正在 学 习 的 人 ， 哪 怕 是 学 过 的 人 也 
要 请 您 予以 充分 的 注意 。 

“统计 的 假设 检验 ”并 不 是 某 一 种 分 析 方法 的 名 称 ， 而 是 一 个 统称 。 统 计 的 假设 
检验 包括 

+ 总 体 均值 差 的 检验 ( 即 所 谓 的 + 检验 ) 

* 独立 性 检验 ( 即 所 谓 的 刀 检 验 ) 

“总 体 比例 差 的 检验 

* 总 体 方差 比 的 检验 

+ Wilcoxon 检验 


图 具体 实例 

o 总 体 均值 差 的 检验 

推测 “东京 地 区 全 体 工薪 阶层 平均 每 月 的 零用 钱 额度 ”和 “大 孤 地 区 全 体 工薪 阶 
层 平均 每 月 的 零用 钱 额度 ”之 间 存 在 着 怎样 的 差异 。 





零用 钱 额度 
ne (日 元 ) 





39400 平均 41060 日 元 


mow» 


38500 平均 39260 日 元 











2802 
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o 独立 性 检验 
推测 总 体 中 “学 生 类 型 ”和 “最 喜爱 的 艺术 家 ”之 间 的 Cramer 关联 系数 ( 本 书 
中 不 做 讲解 ) 的 值 是 否 为 0， 换 句 话说 就 是 推测 “学 生 类 型 ”和 “最 喜爱 的 艺术 家 ” 


之 间 是 否 相关 联 。 














(单位 : 人) 
最 喜爱 的 艺术 家 合 计 
A B c D 
初中 生 10 19 12 5 47 
学 生 类 型 | 高 中 生 13 8 15 16 52 




















请 您 不 要 认为 “从 数据 中 不 是 可 以 清楚 地 知道 ， 东 京 的 工薪 阶层 收入 的 多 一 些 嘛 ! ” 必 
须 注意 的 是 ， 表 中 所 记录 的 是 样本 信息 而 并 非 总 体 的 信息 。 这 里 再 次 重申 , 统计 的 假设 检验 ， 
是 分 析 者 通过 样本 数据 ， 来 推测 其 建立 的 关于 总 体 的 假设 是 否 成 立 的 一 种 分 析 方法 。 

统计 学 的 假设 检验 虽然 很 有 名 ， 但 却 不 像 人 们 所 想 的 那样 简单 ， 所 以 对 于 以 上 问题 的 分 
析 结 果 就 不 做 介绍 了 。 

对 统计 学 的 假设 检验 感 兴趣 的 读者 ， 可 以 参见 本 系列 图 书 中 的 《漫画 统计 学 》 
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2.2 Kaplan-Meier 法 

Kaplan-Meier 法 是 一 种 估计 生存 率 的 方法 。Kapla 和 Meier 都 是 人 的 名 字 ， 前 者 
指 的 是 Edward Kaplan， 后 者 指 的 是 Paul Meier。 

Kaplan-Meier 法 的 特点 就 在 于 它 能 够 估计 生存 率 。 例 如 ， 分 析 者 将 肺癌 患者 作为 
关心 对 象 ， 在 同时 参考 以 下 患者 数据 之 后 对 生存 率 进行 估计 。 


* 在 观察 期 间 ， 死 于 交通 事故 等 与 肺癌 无 关 的 原因 的 患者 
` 在 观察 期 间 转院 的 患者 
o 在 分 析 者 所 规定 的 观察 时 间 内 没有 死亡 的 患者 





图 具体 实例 
下 表 是 对 肺癌 晚期 患者 从 开始 使 用 抗 癌 药 物 起 的 观察 记录 。 
从 开始 使 用 
抗 癌 药 物 起 的 时 间 观察 结果 
(日 ) 

A 17 | 1 一 死 于 肺癌 
B 10 0 一 至 观察 结束 依然 存活 
18 9 一 FF SMA 
p 20 1 一 HF WR 
E 7 1 一 RF 
F 6 0 一 转院 
G 9 1 一 死 于 肺癌 
H 2 0 一 至 观察 结束 依然 存活 
I 8 0 一 死 于 与 肺 痛 无 关 的 原因 
J 24 0 一 至 观察 结束 依然 存活 











233 


{EM Kaplan-Meier 法 ， 可 以 得 到 下 图 所 示 结 果 。 








KER 
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正如 此 处 所 举 的 具体 事例 那样 ， 利 用 Kaplan-Meier 法 可 以 估计 某 一 群体 的 存活 率 ， 虽 然 
说 不 是 一 件 坏事 ,但 多 少 有 些 遗 幅 。 我 们 可 以 使 用 Kaplan-Meier 法 对 “服用 药剂 X 的 患者 群 ”、 


“服用 药剂 Y 的 患者 群 ” 以 及 “服用 任何 药剂 的 患者 群 ”的 存活 率 进行 估计 ， 但 是 如 果 要 判 
断 它们 之 间 是 否 存 在 差异 的 话 ， 就 要 使 用 Logrank 检验 OK 本 书 中 不 做 讲解 ) 进行 讨论 了 ， 
这 一 点 需要 读者 了 解 。 
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